课件及 Demo 下载链接
https://gitee.com/geektime-geekbang/geektime-Spark
作者回复: Spark和jackjson没依赖关系,是不是你工程中的其他依赖和Jackson冲突?
作者回复: 在任务中间使用数据持久化将重要中间结果持久化起来,或者使用checkpoint ,后面调优环节会详细介绍。你们分多个任务有点重了,建议分多个stage或job
作者回复: 如果要测试代码可用性可以先用小的数据直接在本地跑,或者在测试集群中跑,不过一般线上测试才能满足要求。因为有些异常数据测试环境不一定有。另外代码在不同量级的数据上跑出来效果不一样。