本阶段主要内容
- 快速了解Hive
- 数据库和数据仓库的区别
- Hive安装部署
- Hive使用方式之命令行方式
- Hive使用方式之JDBC方式
- Set命令的使用
- Hive的日志配置
- Hive中数据库的操作
- Hive中表的操作
- Hive中数据类型的应用
- Hive表类型之内部表+外部表
- Hive表类型之内部分区表
- Hive表类型之外部分区表
- Hive表类型之桶表+视图
- Hive数据处理综合案例
- Hive高级函数之分组排序取TopN
- Hive高级函数之行转列
- Hive高级函数之列转行
- Hive的排序函数
- Hive的分组和去重函数
- 一个SQL语句分析
- Hive的Web工具-HUE
- 常见的数据压缩格式介绍
- 数据压缩格式选择建议和压缩位置
- 数据压缩格式案例实战分析
- 默认未压缩格式演示
- Deflate压缩格式演示
- Gzip压缩格式演示
- Bzip2压缩格式演示
- Lz4压缩格式演示
- Snappy压缩格式演示
- Lzo压缩格式演示
- 数据存储格式之TextFile的原理及使用
- 数据存储格式之SequenceFile的原理及使用
- 数据存储格式之RCFile的原理及使用
- 数据存储格式之ORC的原理及使用
- 数据存储格式之Parquet的原理及使用
- 数据存储格式总结
- 数据压缩格式和存储格式在数仓中的应用
欢迎加入QQ群聊人生、谈理想、解决各种大数据疑难问题!
QQ群号:938632081