极客时间-轻松学习，高效学习-极客邦

光脚的sun

2018-11-24

老师，现在都说flink更优秀，是不是我们直接跳过mr和spark直接学flink就行了？

作者回复: 如果从MapReduce，spark，flink一路学过来，就会发现他们一脉相承的，如果理解了前面的，学习后面的很多地方甚至可以秒懂。

登山的时候，老司机们都走Z字形，有时候最长的路是最容易的路。



 65
三木子

2018-11-24

比如学习机器学习，可能有很多人和我有同感，基本上是从入门到放弃。我自己也思考了原因。主要是恐惧心态，因为数学差，恐惧那些数学公式，而现在又崇尚几十天学会xxx，这会让人更加焦虑，更不能静下心学习。所以我认为解决问题主要根本也就是调整心态，想象学数学公式就像谈恋爱，从陌生到熟悉，再到走入婚姻的殿堂，不是一蹴而就，罗马不是一天建成的。所以公式一遍看不懂就看两遍，三遍，刻意练习，逃离舒适区。念念不忘，必有回响！

 1

 31
小美

2018-11-25

spark优势在于迭代式的内存运算，适合于做大数据分析，机器学习之类的，flink是流式计算框架，对于实时性任务也许更好，对于机器学习内任务，spark还是要好点

作者回复: 👍🏻



 25
老男孩

2018-11-25

惭愧，我遇到的产品经理或者需求人员，基本上分为两类。一类经常说，这是客户的要求必须马上改，用客户来压制研发。一类比较以自我为中心，把自己的观点等同于用户的观点。常常想当然，结果用户一看不是我想要的。结果就是开发人员一次次的从坑里刚爬上来，又被产品一脚踹下去。有几次我真的无法克制，有一种想套麻袋然后一顿打的冲动。🤔非常赞同老师的观点，不管解决技术问题，还是设计产品都需要深刻的洞察力。想起前面您说的抽象是事物本质的洞察，遇到问题先猫在后面（虽然这种方式比较猥琐），冷静思考，暗中观察，从别人的方案或者错误中总结发现规律，然后顺势而为。

作者回复: 👍🏻



 25
无心乐乐

2018-11-24

第一次在极客写留言，感觉这个专栏的老师真的是用心良苦，不只是技术的教授，更是经验的传递。
我们常常意识不到问题的存在，直到有人解决了这些问题。
醍醐灌顶，受益良多！！

作者回复: 谢谢鼓励，共勉～



 22
Lambda

2018-11-26

看了一些留言，感觉大家还是”面向工具“学习，对层出不穷的”工具“，感到困惑。但是归根结底，这些工具本身还是计算机科学中很多基础概念的具象化，因此，”面向思想“学习应该是更好的一种做法。先对一种最原始的实现透彻的研究，理解其背后的思想和设计理念，然后再逐步学习后期更为先进的技术，这种学习路径应该更为有效。

作者回复: 赞



 17
张闯

2019-04-04

理解了java8的lambda集合操作相比于传统集合操作的优势，就理解了spark相比于MapReduce的优势。
第一步，将集合对象封装成流式对象。
第二部，将函数传递给流式对象，在流式对象中执行内部循环。
spark之所以快，就是将外部循环替换成了内部循环。
传统的面向对象编程思想下，是将一个集合作为数据对象传递给一个方法，这个方法会return一个新的数据集，然后再把这个新的数据集作为入参传递给下一个方法。一趟接一趟，最终得到想要的数据处理结果。
函数式编程思想是，先把集合封装成流，我把上面两个方法改写成无状态函数丢给这个集合流，对于集合内的每一项会依次执行这两个函数，最终这个集合就是一个新的集合。只循环一趟。
原本需要做连续循环处理的次数越多，spark体现出的效率提升就越明显。

lambda里面叫Stream，spark里面叫RDD。

展开



 11
weiruan85

2019-07-31

客户：我想租一匹马，你帮忙打听下一天多钱
     fey：你租马时干什么用呢，犁地还是自己骑。
     客户：自己骑
     fey：那您骑马时准备干什么去呢
     客户：我打算骑着买东西
     fey：打算买什么东西呢，去那买呢
    客户：我打算去兰州，买一碗牛肉面
     fey：为什么要求兰州买牛肉面呢
    客户：其他地方的不好吃
      fey：我认识一家兰州人开的牛肉面馆，味道很正宗，你去尝尝。
    客户：确实好吃，再页不用去兰州了。


展开



 8
Dream.

2018-11-26

乔布斯还在世的时候就说过用户永远不知道他们想要的是什么，只有我们做出来了，他们才发现这就是他们想要的。
这几年来一直将这句话当做自己需求分析时的座右铭。
但一直不能领会其中的精髓，今天看完老师的专栏，有种拨开云雾的感觉。
其实我们大多时候把结果当成了原因，并且缺乏了深度的思考以及洞察力。



 6
hua168

2018-11-24

看了这篇文章，这个价格，值了！很值！！超值得！！！不到教我们技术还教我们思想！大神真的很负责👍…
Spark可以代替mapReduce那我理解，是不是可以直接跳过mapReduce直接学习Spark？如果有一个东西比Spark更好，我也直接跳过Spark？
我先把您的大数据学完，再补学java大数据编程，可以吧？
我们在广州骗子太多，学会了观察他们是怎么骗的，总结骗子大部分都是利用贪心骗钱。这个算不😜？



 6
呆猫

2018-11-26

我要把这篇文章推荐给我们的产品经理去好好读读



 5
小辉辉

2018-11-25

好的提问艺术更能帮助我们深入理解和思考问题



 4
hunterlodge

2018-11-26

工作中，一个新的方案出现的时候，如果它在某个或某些方面优于当前最好方案，我一定会去思考它的catch(另一面)是什么？比如新方案更快，我就大概会看看它的空间使用率、可维护度、全面度。一般都会发现一些问题。生活里也是如此，对表面上只有好处而无需付出或者代价很低的东西永远保持警惕。说白了，世上没有免费的午餐，一些都是权衡利弊的结果



 3
Abyte

2018-11-25

大数据开发处理数据过程中难免被领导提一些需求，做各种各样的报表统计。我们第一手接触数据，如果我们能再有精力投入业务，是不是也能主动做出一些老板需要的报表统计，提升自己的价值

作者回复: 👍🏻



 3
纯洁的憎恶

2018-11-24

李老师不仅讲大数据还讲大局观😄



 2
张小喵

2019-12-03

老师，我有一个疑问，本节里面的word count示例代码，map完了直接reduce，spark中一个map操作是针对的一个RDD分片，并不是针对的所有的分片（要统计文件的所有分片），我们reduce的操作不是应该处理所有的map数据结果汇集之后的RDD吗，为何只是一个map计算的结果？

作者回复: reduce是针对所有分片的。

但是我们程序不需要关心有多少分片，程序只关注数据处理逻辑，分片以及和分布式有关的一切都由Spark框架自己完成。



 1
黄吉吉

2018-11-25

老师有开其他博客、公众号嘛？想听老师更多的分享

作者回复: 谢谢支持，可以看看我写的书《大型网站技术架构：核心原理与案例分析》



 1
REAL_MADIRD

2018-11-24

养成穿透问题现象直达问题本质的能力真的很重要，老师有机会可以多给我分享下如何培养这种能力，或者学习编程过程中的一些方法论，我觉得有时这比学习本身更重要



 1
吴科🍀

2018-11-24

老师，讲讲基于spark的数据分析和机器学习吧



 1
随缘_NJ

2018-11-24

发现用户的需求，用户永远不清楚想要什么，总结的真好



 1