20 | 常用数据格式原理和使用：TEXT、CSV、JSON、PARQUET在Spark中的使用-Spark核心原理与实战-极客时间

Spark 核心原理与实战

王磊

Yeahmobi 大数据架构师，阿里云 MVP

3370 人已学习

已下架

课程目录

已完结/共 60 讲

第一章：Spark概述及入门实战 (10讲)



第二章：深入Spark RDD原理 (6讲)



第三章：Spark SQL、DataFrame、DataSet原理和实战 (3讲)



第四章：深入理解Spark数据源 (7讲)



第五章：Spark流式计算原理和实战 (6讲)



第六章：Spark作业调度和资源分配算法 (7讲)



第七章：亿级数据处理平台Spark性能调优 (7讲)



第八章：Spark机器学习库 (8讲)



第九章：Spark的未来与实战经验分享 (6讲)





Spark 核心原理与实战



留言





沉浸
阅读





手机端



回顶部

当前播放: 20 | 常用数据格式原理和使用：TEXT、CSV、JSON、PARQUET在Spark中的使用

00:00 / 00:00

高清

高清

1.0x

2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看

本节摘要

课件及 Demo 下载链接
https://gitee.com/geektime-geekbang/geektime-Spark

登录后留言

全部留言(1)

最新
精选

碧雪天虹

val df_csv = spark .read // 声明使用分号分隔列 .option("sep", ";") // 声明第一行为表头 .option("header", "true") // 载入数据 .csv(resDir + "/people.csv") df_csv.show df_csv.write // 声明第一行为表头 .option("header", "true") // 输出数据 .csv(resDir + "/" + filePrefix + "csv_result") csv方法的源代码注释上, 标明了可配置的相关option集合

2021-02-01





收起评论