本阶段主要内容

  1. Spark 3.0.0版本介绍
  2. 基于Spark 3.x版本开发代码
  3. 在已有的大数据集群中集成Spark 3.x环境
  4. 向YARN中同时提交Spark 2.x和Spark 3.x的代码
  5. Spark 1.x~3.x的演变历史
  6. 自适应查询执行之自适应调整Shuffle分区数量
  7. 自适应查询执行之动态调整Join策略
  8. 自适应查询执行之动态优化倾斜的 Join
  9. Spark 3.x新特性之动态分区裁剪
  10. Spark 3.x新特性之加速器感知调度
  11. Spark 3.x新特性之Catalog 插件 API
  12. Spark 3.x新特性之更好的 ANSI SQL 兼容性
  13. 在SparkSQL 命令行中集成Hive
  14. 在SparkSQL 代码中集成Hive
  15. SparkSQL写入Hive表的几种方式

欢迎加入QQ群聊人生、谈理想、解决各种大数据疑难问题!

QQ群号:938632081

QQ群

results matching ""

    No results matching ""