论坛元老
- 威望
- 194
- 贡献
- 282
- 热心值
- 21
- 金币
- 83369
- 注册时间
- 2020-8-31
|
课程介绍:
本课程主要讲解如何集成 HBase 与 MapReduce 进行数据的迁移,并且最后通过跟踪源码进行分析数据的装载过程。
课程背景:
在企业中,经常需要把各种数据源导入进 HBase 中,本课时讲解一些最常用的导入方式,以及如何与 MapReduce 进行集成,让大家能掌握 HBase 数据的导入与导出。
核心内容:
1.HBase内置 MapReduce 工具使用
2.HBase 表当作数据源和数据目标的处理
3.普通导入方式与 bulk load 导入
4.bulk load 执行流程
软件环境:Centos6.4
是否提供资料:是
课程等级:高级
适合人群:
具有Linux、JAVA SE、Hadoop 基础
课程目录:
1 HBase自带 MapReduce工具的使用 18:54
本课时讲解通过设置环境变量来执行 HBase 自带的 MapReduce 工具进行数据的迁移。
2 HBase 表数据迁移 20:00
本课时讲解常见的 HBase 表的数据迁移场景,然后演示如何手动编写 MapReduce 完成数据迁移。
3 HDFS 数据导入 HBase 12:28
本课时主要讲解通过编写 MapReduce 完成 HDFS 与 HBase 表的数据相互转换。
4 HBase BulkLoad 12:29
本课时介绍如何编写 MapReduce 把 HDFS 中的文件转换为 HFile 文件,然后装载数据进 HBase 中的表。
5 BulkLoad 源码分析 05:09
本课时通过追踪源码分析 HBase BulkLoad 的过程。
|
|