Spark 核心原理与实战
王磊
Yeahmobi 大数据架构师,阿里云 MVP
3370 人已学习
已下架
课程目录
已完结/共 60 讲
第一章:Spark概述及入门实战 (10讲)
第二章:深入Spark RDD原理 (6讲)
第三章:Spark SQL、DataFrame、DataSet原理和实战 (3讲)
第四章:深入理解Spark数据源 (7讲)
第五章:Spark流式计算原理和实战 (6讲)
第六章:Spark作业调度和资源分配算法 (7讲)
第七章:亿级数据处理平台Spark性能调优 (7讲)
第八章:Spark机器学习库 (8讲)
第九章:Spark的未来与实战经验分享 (6讲)
Spark 核心原理与实战
登录|注册
留言
3
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 12 | Spark RDD原理:RDD依赖关系、Stage、RDD持久化、 Spark PreferredLocation及CheckPoint原理和使用
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
本节摘要
登录 后留言

全部留言(3)

  • 最新
  • 精选
超级丹
移动数据不如移动计算吧

作者回复: 对

2020-11-28
1
李凯
老师你好,有个问题,stage是由一组rdd组成,一组rdd指的是多个rdd还是一个rdd不同分区。假如我数据源是一个list集合,他就是一个rdd,这样就是一个rdd了
2021-03-06
0273522
为什么叫内存持久化。持久化不是在断电不丢失的存储里保存,才叫持久化。
2020-12-06
收起评论