论坛元老
- 威望
- 58
- 贡献
- 83
- 热心值
- 0
- 金币
- 14148
- 注册时间
- 2020-8-31
|
课程介绍:
本课程介绍 Hive 的简介,了解什么是 Hive 并且为何使用 Hive,以及它与 HBase 和 RDBMS 的关系,最后介绍了数据库与数据仓库的概念与特征。
课程目录:
1Hive 简介 11:46
本课时介绍学习 Hive 之前应具备的知识,什么是 Hive,为何使用 Hive 以及 Hive 的相关资源。
2Hive 与 HBase 关系 03:34
本课时介绍 Hive 与 HBase 的异同点,以及 Hive 与 HBase 整合简介。
3 Hive 与 RDBMS 关系 04:55
本课时从多个角度对比 Hive 与 RDBMS 的异同。
Hive 环境搭建
“工欲善其事,必先利其器”,出自孔子的《论语·卫灵公》,其意指工匠想要使他的工作做好,一定要先工具锋利。本课程我们将要学习 Hive 所需的环境搭建,包括系统的选择、终端的选择、环境的配置以及 Hadoop 和 Hive 的安装。
1 学习 Hive 先决条件 39:53
在本课时中,我们也为开始学习 Hive 准备好需要的条件。下面我们将从三方面开始展开:系统选择、终端选择、环境配置。
3 Hive 安装部署 34:34
本课时主要讲解 Hive 三种运行方式:内嵌模式、独立模式以及完全分布式模式,然后分别进行内嵌模式以及独立模式的安装,最后介绍配置中常用的参数。
Hive 基本原理
本课程介绍 Hive 的体系结构,了解 Hive 的元数据存储,以及它的数据如何存储,并在最后介绍 Hive 的运行机制,了解 MapReduce 如何实现基本的 SQL 操作,而 SQL 又如何转化为 MapReduce 的过程,做到“知其然,知其所以然”。
1 Hive 的体系结构 02:36
本课时介绍 Hive 的体系结构,它主要包括哪些部分,每个部门的主要做什么。
2 Hive 元数据存储 04:04
本课时介绍 Hive 的元数据存储,重点讲了其三种存储模式,其中1、2均属于本地存储,3属于远端存储,在最后介绍了 Hive 元数据表数据字典。
3 Hive 的数据存储 03:41
本课时 Hive 的数据存储,包括四类数据模型:表(Table)、外部表(External Table)、分区(Partition)和桶(Bucket)。
4 Hive 的运行机制 12:39
本课时介绍 Hive 的运行机制,包括 MapReduce 如何实现基本的 SQL 操作和 SQL 如何转化为 MapReduce 操作,做到“知其然,知其所以然”。
|
|