Spark 核心原理与实战
王磊
Yeahmobi 大数据架构师,阿里云 MVP
3370 人已学习
已下架
课程目录
已完结/共 60 讲
第一章:Spark概述及入门实战
(10讲)
第二章:深入Spark RDD原理
(6讲)
第三章:Spark SQL、DataFrame、DataSet原理和实战
(3讲)
第四章:深入理解Spark数据源
(7讲)
第五章:Spark流式计算原理和实战
(6讲)
第六章:Spark作业调度和资源分配算法
(7讲)
第七章:亿级数据处理平台Spark性能调优
(7讲)
第八章:Spark机器学习库
(8讲)
第九章:Spark的未来与实战经验分享
(6讲)
Spark 核心原理与实战
登录
|
注册
留言
1
收藏
沉浸
阅读
分享
手机端
回顶部
Sorry, your browser doesn't support embedded videos.
当前播放: 20 | 常用数据格式原理和使用:TEXT、CSV、JSON、PARQUET在Spark中的使用
00:00
/ 00:00
高清
高清
1.0x
2.0x
1.5x
1.25x
1.0x
0.75x
0.5x
音量
网页全屏
全屏
00:00
付费课程,可试看
本节摘要
课件及 Demo 下载链接
https://gitee.com/geektime-geekbang/geektime-Spark
登录
后留言
全部留言(1)
最新
精选
碧雪天虹
val df_csv = spark .read // 声明使用分号分隔列 .option("sep", ";") // 声明第一行为表头 .option("header", "true") // 载入数据 .csv(resDir + "/people.csv") df_csv.show df_csv.write // 声明第一行为表头 .option("header", "true") // 输出数据 .csv(resDir + "/" + filePrefix + "csv_result") csv方法的源代码注释上, 标明了可配置的相关option集合
2021-02-01
收起评论