Spark 核心原理与实战
王磊
Yeahmobi 大数据架构师,阿里云 MVP
3370 人已学习
已下架
课程目录
已完结/共 60 讲
第一章:Spark概述及入门实战 (10讲)
第二章:深入Spark RDD原理 (6讲)
第三章:Spark SQL、DataFrame、DataSet原理和实战 (3讲)
第四章:深入理解Spark数据源 (7讲)
第五章:Spark流式计算原理和实战 (6讲)
第六章:Spark作业调度和资源分配算法 (7讲)
第七章:亿级数据处理平台Spark性能调优 (7讲)
第八章:Spark机器学习库 (8讲)
第九章:Spark的未来与实战经验分享 (6讲)
Spark 核心原理与实战
登录|注册
留言
8
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 01 | 课程介绍
00:00 / 00:00
高清
  • 高清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
登录 后留言

全部留言(8)

  • 最新
  • 精选
iMARS
可以作为数据中台承载数据的基础设施么

作者回复: 可以作为数据中台的查询引擎。

2020-11-04
2
1
Dave
如果做流水对账怎么应用呢

作者回复: 需求是离线对账?

2020-11-03
2
1
Geek_3b1096
Offer来了读者

作者回复: 感谢支持

2020-11-12
jasper
老师求助个问题spark2.3.1 thriftserver yarn模式有时会频繁FUll GC ,我们业务中大量使用beeline连接,以前使用默认并行GC 时在业务高峰期时也偶尔会频繁Full gc,后面换成了G1 gc 使用一周后还算稳定,但还是会频繁full gc,有个现象是spark thriftserver 进程占用内存越来越高,感觉像是内存泄漏,正常情况下dump内存下来发现是sparkEnv里面使用的hadoopMedata这个hashMap使用了软引用,缓存JobConf等信息,这个数据结构占用内存最高,没发现哪里有内存泄漏,当频繁发生full gc时dump不下能存
2020-11-05
2
IT蜗壳-Tango
感觉好的朋友在学这个,准备了解一下。打卡学习
2020-11-10
1
Geek_825b54
老师做大数据10多年了吗?在国内属于骨灰级了
2020-11-02
1
hello🧃🪀🪀🪀
前排
2020-11-02
1
Jae
您好,从事数据挖掘需要重点了解 spark 哪些方面的知识点?
2020-11-15
收起评论