编辑回复: 每周一三五更新,一周更新三篇。
作者回复: 好问题,这块我是这么打算的: 课程更新完毕之后,可以把课程里面所有的代码,整理出一份Python版本的,然后放到github上(暂时不会考虑放到课程里,不同语言的代码放一起太凌乱了)。随着课程的推进,当然也可以征集感兴趣的小伙伴一起做这件事情。 不过毕竟课程还没更完,所以可能需要小伙伴们稍安勿躁,等待一段时间~ 不过,还是那句话,其实课程中涉及到的代码实现,虽然是用Scala实现的,但其实每句代码都会有注释和讲解,所以我觉得语言上确实算不上是障碍~
作者回复: 可以的哈,零基础入门~ 有开发经验更佳~
作者回复: 直播已经回答啦~
作者回复: 特别喜欢讲故事~ 欢迎欢迎~
编辑回复: 欢迎加入学习,加油!
作者回复: 欢迎👏👏👏
作者回复: 首先恭喜老弟~ 希望这门课对老弟的职业发展有所帮助,一起加油~
作者回复: 欢迎归来~
作者回复: 其实课程里面涉及到的知识点和开发技巧,对于2.x和3.x来说都是一致的~ 所以版本方面不用特别担心,课程里面涉及到的代码,在2.x和3.x都是能跑通的~ 回答你的问题,相比2.x,3.x的改进还是挺多的,不过从性能的角度来看,最主要的改进还是在Spark SQL部分,比如像AQE(Adaptive Query Execution)、DPP(Dynamic Partition Pruning)等等。 当然,完整的改进列表,可以参考3.0的release note:https://spark.apache.org/releases/spark-release-3-0-0.html