Spark 核心原理与实战
王磊
Yeahmobi 大数据架构师,阿里云 MVP
3370 人已学习
已下架
课程目录
已完结/共 60 讲
第一章:Spark概述及入门实战
(10讲)
第二章:深入Spark RDD原理
(6讲)
第三章:Spark SQL、DataFrame、DataSet原理和实战
(3讲)
第四章:深入理解Spark数据源
(7讲)
第五章:Spark流式计算原理和实战
(6讲)
第六章:Spark作业调度和资源分配算法
(7讲)
第七章:亿级数据处理平台Spark性能调优
(7讲)
第八章:Spark机器学习库
(8讲)
第九章:Spark的未来与实战经验分享
(6讲)
Spark 核心原理与实战
登录
|
注册
留言
8
收藏
沉浸
阅读
分享
手机端
回顶部
Sorry, your browser doesn't support embedded videos.
当前播放: 01 | 课程介绍
00:00
/ 00:00
高清
高清
1.0x
2.0x
1.5x
1.25x
1.0x
0.75x
0.5x
音量
网页全屏
全屏
00:00
付费课程,可试看
登录
后留言
全部留言(8)
最新
精选
iMARS
可以作为数据中台承载数据的基础设施么
作者回复: 可以作为数据中台的查询引擎。
2020-11-04
2
1
Dave
如果做流水对账怎么应用呢
作者回复: 需求是离线对账?
2020-11-03
2
1
Geek_3b1096
Offer来了读者
作者回复: 感谢支持
2020-11-12
jasper
老师求助个问题spark2.3.1 thriftserver yarn模式有时会频繁FUll GC ,我们业务中大量使用beeline连接,以前使用默认并行GC 时在业务高峰期时也偶尔会频繁Full gc,后面换成了G1 gc 使用一周后还算稳定,但还是会频繁full gc,有个现象是spark thriftserver 进程占用内存越来越高,感觉像是内存泄漏,正常情况下dump内存下来发现是sparkEnv里面使用的hadoopMedata这个hashMap使用了软引用,缓存JobConf等信息,这个数据结构占用内存最高,没发现哪里有内存泄漏,当频繁发生full gc时dump不下能存
2020-11-05
2
IT蜗壳-Tango
感觉好的朋友在学这个,准备了解一下。打卡学习
2020-11-10
1
Geek_825b54
老师做大数据10多年了吗?在国内属于骨灰级了
2020-11-02
1
hello🧃🪀🪀🪀
前排
2020-11-02
1
Jae
您好,从事数据挖掘需要重点了解 spark 哪些方面的知识点?
2020-11-15
收起评论