• Geek_038655
    置顶
    2021-09-13
    请问:什么时候更新?一周更新多少节?

    编辑回复: 每周一三五更新,一周更新三篇。

    
    5
  • Alvin-L
    2021-09-10
    可否追加python版的代码。平常都是使用python

    作者回复: 好问题,这块我是这么打算的: 课程更新完毕之后,可以把课程里面所有的代码,整理出一份Python版本的,然后放到github上(暂时不会考虑放到课程里,不同语言的代码放一起太凌乱了)。随着课程的推进,当然也可以征集感兴趣的小伙伴一起做这件事情。 不过毕竟课程还没更完,所以可能需要小伙伴们稍安勿躁,等待一段时间~ 不过,还是那句话,其实课程中涉及到的代码实现,虽然是用Scala实现的,但其实每句代码都会有注释和讲解,所以我觉得语言上确实算不上是障碍~

    
    14
  • 初心
    2021-09-06
    有开发经验但没有大数据处理经验,女孩纸一名,能学会吗

    作者回复: 可以的哈,零基础入门~ 有开发经验更佳~

    共 2 条评论
    5
  • Neo-dqy
    2021-09-14
    老师好,我是研一新生,导师这里主要做的是nlp和知识图谱相关的研究,但是我个人更倾向于成为一名大数据开发工程师,不知道您能不能给一些对于校招学生的学习建议?我本科时在 Jupyter notebook上使用过sklearn来进行机器学习实验,但是貌似在企业里使用spark来做机器学习才是更普遍的选择,请问spark做机器学习应用时,会用到微服务技术这些来部署吗?最后想问下您对于Flink的看法,它会不会撼动spark的地位?

    作者回复: 直播已经回答啦~

    
    3
  • 夜空中最亮的星
    2021-09-07
    我就喜欢听故事,必须订阅

    作者回复: 特别喜欢讲故事~ 欢迎欢迎~

    
    2
  • 钱鹏 Allen
    2021-09-07
    拿好自己的小本本,开始自己的Spark学习之旅!!

    编辑回复: 欢迎加入学习,加油!

    
    2
  • zhongmin
    2021-09-06
    从《spark性能调优实战》转过来的👍

    作者回复: 欢迎👏👏👏

    
    2
  • Geek_5d2c69
    2021-11-03
    感谢吴老师!new grad刚毕业 入职了湾区一家公司,开始onboarding的第一个project就是用pyspark做offline ML model然后转线上。遇到了很多spark上面的问题和code bug,希望上这门课可以帮我更加熟悉spark!

    作者回复: 首先恭喜老弟~ 希望这门课对老弟的职业发展有所帮助,一起加油~

    共 2 条评论
    1
  • Joey
    2021-09-30
    说起来spark太有感觉了,毕业后的第一家公司就是负责spark、hbase相关的开发;后来跳槽了就主要做实时kafka、flink这一块了,已经两年没写过spark相关的代码了。再来重温一下spark,重温当时倔强的自己哈哈...

    作者回复: 欢迎归来~

    
    1
  • Owen
    2021-09-10
    老师,你教的是哪个版本呢? 还有,能简单说一下spark2和3的不同点吗,谢谢

    作者回复: 其实课程里面涉及到的知识点和开发技巧,对于2.x和3.x来说都是一致的~ 所以版本方面不用特别担心,课程里面涉及到的代码,在2.x和3.x都是能跑通的~ 回答你的问题,相比2.x,3.x的改进还是挺多的,不过从性能的角度来看,最主要的改进还是在Spark SQL部分,比如像AQE(Adaptive Query Execution)、DPP(Dynamic Partition Pruning)等等。 当然,完整的改进列表,可以参考3.0的release note:https://spark.apache.org/releases/spark-release-3-0-0.html

    
    1