作者回复: 共同进步~
作者回复: 把它当个手册或者字典,有需要的时候再查。内容太多了,没必要地毯式扫描,平时开发的时候,有API忘了,或者某个函数忘了,再去翻就是了。翻得多了,一些常用的机会记得比较牢了。 那些不太常用的,暂时不理他好了~ 没关系的。总之是问题导向、目的导向。
作者回复: 没错,严重同意,调优的本质是“平衡”,是一门关于平衡的学问。光靠怼硬件是不对的,既不经济、也不划算,最重要的是,出不来效果。 看到你的名字,让我想起曾经打Dota的时光,哈哈哈!AOE(Area Of Effect)范围性技能,老弟五一节快乐!一起加油~
作者回复: 敢问老兄是什么场景,需要存储几万列的宽表?一定要用这么大的宽表吗?是否可以考虑数仓中星型模型或是雪花模型的设计呢?
作者回复: 咱们的专栏就是在讲Spark优化的套路呀~ 先是方法论,然后是理论基础、调优技巧,技巧又分为通用技巧和Spark SQL技巧。希望专栏的内容能帮到你哈~
作者回复: 这个范畴有点略大哈~ 具体指的哪方面呢? 我们确实是算法团队,做机器学习在计算广告业务的应用和落地,整条机器学习流水线上涉及的环节比较多,比如: 数据提取、处理、清洗、探索 特征工程、样本工程 模型训练、预测、验证 你说的数据探索和特征工程,具体想了解哪方面呢?是数据处理的逻辑、或者说功能上的用法?还是说性能上的调优?如果是性能调优的话,其实27、28、29讲会有不少真实的调优案例,那些都来自于我们平时的工作,到时候可以关注下哈~
作者回复: 欢迎欢迎~ 感谢认可哈~
作者回复: 可以的~ 课程深入浅出,有很多的故事、类比,帮助大家理解消化
作者回复: 有的~
作者回复: 互相学习~