Spark

本阶段主要内容

  1. 宽依赖和窄依赖
  2. Stage的理解
  3. Spark任务的三种提交模式
  4. Shuffle介绍
  5. 三种Shuffle机制分析
  6. checkpoint概述
  7. checkpoint和持久化的区别
  8. checkpoint代码开发和执行分析
  9. checkpoint源码分析之写操作和读操作
  10. Spark程序性能优化分析
  11. 高性能序列化类库Kryo的使用
  12. 持久化或者checkpoint
  13. JVM垃圾回收调忧
  14. 提高并行度
  15. 数据本地化
  16. 算子优化
  17. SparkSql快速上手使用
  18. 实战:SparkSQL实现TopN主播统计

欢迎加入QQ群聊人生、谈理想、解决各种大数据疑难问题!

QQ群号:938632081

QQ群

results matching ""

    No results matching ""