学分高考 web前端

掌握Hive架构需要学什么?

发布时间: 2022-05-17 19:30:01

Hive是建立在Hadoop上的数据仓库基础构架,它提供了一系列的工具,可以用来进行数据提取转化加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言,它允许熟悉SQL的用户查询数据。因此掌握Hive是学习大数据的必修课,那么掌握Hive架构需要学什么呢?本文将为大家讲述Hive的具体学习内容,下面是Hive视频教程的学习大纲:

Hive架构

第一章 数据管理与数据仓库

1. 数据分析系统不同数据来源

2. 数据管理--文件管理服务&跨部门文件管理规范

3. 数据管理--文件管理规范示例

4. 数据管理--数据质量检测

5. 数据仓库--基本概念&和数据库区别

6. 数据仓库--数据仓库主要特征

7. 数据仓库--数据仓库分层架构

8. 数据仓库--数据仓库元数据管理

第二章ApacheHive介绍及安装部署

1. 介绍&Hive实现思路模拟

2. 架构&组件

3. 与RDBMS区别

4. 安装部署--内置derby版以及缺陷

5. 安装部署-mysql版安装

6. 安装部署-几种交互方式

7. 初体验-理解什么是映射

第三章Apache Hive—DDL

1. DDL--创建表--数据类型&分隔符

2. DDL--创建表--默认分隔符

3. DDL--创建表--分区表创建

4. DDL--创建表--双分区表&小结

5. DDL--创建表--分桶表创建&分桶数据导入

6. DDL--创建表--分桶表总结&分桶表好处

7. DDL--创建表--内外部表&like复制

8. DDL--修改表&显示命令

第四章Apache Hive—DML

1. DML--load装载数据

2. DML--insert&多重插入&动态分区

3. DML--导出数据

4. DML--select查询

第五章Apache Hive—函数及其他操作

1. join操作

2. 命令行&参数配置方式

3. 内置运算符函数&dual测试方式

4. 自定义函数UDF开发

5. 了解transform

6. 特殊分隔符处理

总而言之,该课程适合有一定大数据基础的学员进行学习。在完成上面的学习大纲后,大家就可以在hive上建立企业自己的数据数仓平台,还能针对企业自己的业务实现自己的UDF函数。大家还在等什么?现在就在下方填写课程试听申请,立即就能获取相应的视频课程在线学习!

温馨提示:
本文【掌握Hive架构需要学什么?】由作者教培参考提供。该文观点仅代表作者本人,学分高考系信息发布平台,仅提供信息存储空间服务,若存在侵权问题,请及时联系管理员或作者进行删除。
我们采用的作品包括内容和图片部分来源于网络用户投稿,我们不确定投稿用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的权利,请联系我站将及时删除。
内容侵权、违法和不良信息举报
Copyright @ 2024 学分高考 All Rights Reserved 版权所有. 湘ICP备17021685号