瑞客论坛

 找回密码
 立即注册
查看: 3541|回复: 20

Hive数据仓库实践 视频教程

[复制链接]

金币7578  第144名

217

主题

4

回帖

7621

积分

论坛元老

Rank: 8Rank: 8

威望
0
贡献
41
热心值
2
金币
7578
注册时间
2020-8-31
发表于 2019-3-29 13:20 | 显示全部楼层 |阅读模式
课程介绍:
本课程将从Hive的基本概念入手,深入解析Hive的使用方式、HQL语法以及常用的仓库模式设计和Hive优化方法,并对未来Hive的发展和高级特性做一些简单介绍,并通过最后的案例实践巩固学习内容。通过本课程的学习,将能够胜任大多数互联网场景下的大数据分析和数据开发任务。

Hive数据仓库实践 视频教程-1.png

适用人群:
面向数据分析和数据开发,希望从事和进一步了解互联网数据仓库以及数据分析的学员。
课程目录:
第一课 Hadoop与MapReduce
  • 1) Hive在Hadoop Ecosystem中的地位
  • 2) Hive的版本演进与目前现状
  • 3) 课程实践环境说明
  • 4) 实操: Hive/Hadoop预备环境安装
第二课 Hive的基本概念与QuickStart
  • 1) Hive的安装部署
  • 2) Hive的基本架构
  • 3) 启动Hive
  • 4) Hive命令行
  • 5) HiveServer与JDBC/ODBC
  • 6) 实操: Hive命令行和ThriftServer基本使用
第三课 数据类型与文件格式
  • 1) Hive支持的基本数据类型
  • 2) Hive支持的集合数据类型
  • 3) Hive支持的文件格式与优劣对比
第四课 HiveQL:数据定义
  • 1) Hive数据模型
  • 2) Database
  • 3) Table
  • 4) Partition
  • 5) 自定义存储格式
  • 6) 自定义表属性
  • 7) 常用创建/删除/修改表语法
  • 8) 实操: HQL 创建/删除/修改操作练习
第五课 HiveQL:数据操作
  • 1) 加载数据(LoadData)
  • 2) 从查询计算结果加载数据(Insert Table Select)
  • 3) 动态分区(DynamicPartitioning)
  • 4) CTAS(CreateTableAsSelect)
  • 5) 导出数据
  • 6) 实操: 练习以上数据加载计算和导出操作
第六课 HiveQL:数据查询
  • 1) 从最简单的开始
  • 2) Select … From
  • 3) Where条件
  • 4) Group By条件
  • 5) Join
  • 6) 排序(OrderBy/SortBy)
  • 7) ClusterBy/DistributeBy
  • 8) 抽样(Sampling)
  • 9) Union
  • 10) 实操: 练习以上各种查询语法
第七课 Hive函数与自定义函数
  • 1) 查看与调用函数
  • 2) 常用标准函数(UDF)
  • 3) UDAF
  • 4) UDTF
  • 5) UDF/UDAF/UDTF开发
  • 6) 实操: 练习并完成UDF Java开发的作业
第八课 Hive常用模式设计
  • 1) 按天做Partition
  • 2) 分桶(Bucket)
  • 3) 压缩
  • 4) 表Schema变更
  • 5) 实操: 练习以上几种仓库设计模式
第九课 Hive调优
  • 1) Hive参数说明
  • 2) Explain查看执行计划
  • 3) 控制Map/Reduce数
  • 4) 并行执行
  • 5) 推测执行
  • 6) Join优化
  • 7) 数据倾斜问题
  • 8) 动态分区优化
  • 9) 实操: 练习并理解不同优化参数下的执行逻辑
第十课 Hive新特性与其他
  • 1) Hive on Tez
  • 2) Hive on Spark
  • 3) Hive与HBase集成
  • 4) HCatalog
第十一课 案例
  • 1) 广告用户行为分析场景预备
  • 2) 构建Hive表与数据处理
  • 3) 常用分析案例
  • 4) 实操: 完成以上案例作业

游客,如果您要查看本帖隐藏内容请回复


回复

使用道具 举报

金币3680  第417名

0

主题

2670

回帖

8283

积分

论坛元老

Rank: 8Rank: 8

威望
2410
贡献
2193
热心值
0
金币
3680
注册时间
2019-5-25

活跃会员灌水之王一年荣誉奖章在线达人

发表于 2019-7-4 12:52 | 显示全部楼层
6666666666666
回复

使用道具 举报

金币143  第6973名

0

主题

100

回帖

152

积分

注册会员

Rank: 2

威望
3
贡献
6
热心值
0
金币
143
注册时间
2019-7-2
发表于 2019-7-4 13:01 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

金币137  第7215名

0

主题

81

回帖

197

积分

注册会员

Rank: 2

威望
24
贡献
36
热心值
0
金币
137
注册时间
2019-7-3
发表于 2019-9-5 13:30 | 显示全部楼层
ive数据仓库
回复

使用道具 举报

金币1497  第1144名

0

主题

2333

回帖

1万

积分

永久会员

Rank: 8Rank: 8

威望
5503
贡献
5161
热心值
0
金币
1497
注册时间
2019-6-6
发表于 2019-9-5 14:30 | 显示全部楼层
Hive数据仓库实践 视频教程 [修改]
回复

使用道具 举报

金币481  第3182名

0

主题

152

回帖

481

积分

中级会员

Rank: 3Rank: 3

威望
0
贡献
0
热心值
0
金币
481
注册时间
2019-7-8
发表于 2019-9-5 19:05 | 显示全部楼层
看看,感谢分享。
回复

使用道具 举报

金币359  第3898名

3

主题

1585

回帖

853

积分

高级会员

Rank: 4

威望
257
贡献
237
热心值
0
金币
359
注册时间
2019-6-27
发表于 2019-9-6 07:03 | 显示全部楼层
面向数据分析和数据开发,希望从事和进一步了解互联网数据仓库以及数据分析的学员。
回复

使用道具 举报

金币329  第4113名

0

主题

553

回帖

2467

积分

金牌会员

Rank: 6Rank: 6

威望
1011
贡献
1127
热心值
0
金币
329
注册时间
2019-8-12
发表于 2019-9-13 07:51 | 显示全部楼层
嘻嘻嘻嘻嘻嘻嘻嘻
回复

使用道具 举报

金币456  第3311名

0

主题

3507

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
7011
贡献
5575
热心值
0
金币
456
注册时间
2019-6-10
发表于 2019-9-13 09:39 | 显示全部楼层
不错的资源
回复

使用道具 举报

金币891  第1858名

0

主题

325

回帖

1971

积分

永久会员

Rank: 8Rank: 8

威望
769
贡献
311
热心值
0
金币
891
注册时间
2019-10-9
发表于 2019-12-15 12:21 | 显示全部楼层
感谢楼主分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-11-27 00:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表