

极客时间服务号
详情页领取 10 元礼券,到手 ¥89
大数据领域,可以说是过去20年计算机工程界发展最迅速、产生影响最大的一个领域。很多看起来和“大数据”没有什么关系的开源系统,都是从“大数据”这个领域里培育出来的,比如说Kubernetes。
尽管目前互联网用户的数量增长已经逐步停滞,但是存储和处理的数据量的增长并没有慢下来。正是因为大数据领域的发展,使得无论是存储数据,还是处理数据的成本都在不断降低。
今天我们去研读“大数据”领域的经典论文,可以说是一件投入产出比很高的事情。通过学习大数据相关的论文,我们会对计算机工程的各个领域都有更加深刻的认知,这不仅仅是对于「大数据工程师」这样的职位有用,对于做各类后端开发和系统开发的工程师来说,都会有很大的帮助。
但是我们应该怎么学呢?对于不是做大数据底层系统开发的同学,自己找篇论文读一读,也好像囫囵吞枣,没有吃到滋味就忘了是怎么回事儿。
在网上随便一搜,虽然也能找到不少论文被人翻译成了中文,但是往往也只能告诉你“是什么”,却没有办法让你理解“为什么”。这些翻译或者文章,常常给出的是“Bigtable系统是一个稀疏的、分布式的排序好的Map”,却让你没有办法让你理解为什么Bigtable是这样设计的。
所以这次,我们邀请了极客时间《深入浅出计算机组成原理》课程的作者徐文浩老师,通过他十多年研读论文、使用各种开源框架解决大数据问题的经验,带你梳理整个大数据系统的发展脉络,为你分析在整个领域的系统不断往前迭代的过程中,所遇到的具体场景下的问题,还会深入解读其中重要的设计决策背后,能够联系到的计算机底层原理。
这样一来,通过课程内容知识的讲解,你就能够把论文和论文之间联系起来,把论文和具体技术场景联系起来,把论文和计算机原理的底层知识点联系起来。更进一步,你会真正理解Why,而不是只是知道What。
事实上,从徐文浩老师的研读、使用、实践的经验来看,在大数据的世界里,你会使用某个开源框架,是了解到了How,毕竟谁学上两天都可以学会。而了解了开源框架的源码,是弄明白了What,让你在遇到问题的时候,可以更高效地debug。那么,研读完它背后的论文,则是搞清楚了Why,这样你不仅可以参与到开源社区里,去帮助迭代改进这些框架,更可以在未来遇到新问题的时候,有更多的思路可以借鉴。
课程主体划分为以下5大模块。
徐文浩,bothub创始人,布奇托网络科技创始人及CTO。毕业于上海交通大学计算机系试点班,在Trilogy Software写过大型企业软件;在MediaV担任技术总监,从零开始搭建支撑每天百亿流量的广告算法系统;2015年,加入拼多多,参与重写拼多多的交易系统;2016年底创办bothub.ai,为走向海外的中国企业提供智能客服和社交网络营销服务;2019年联合创办布奇托网络科技,为海外中小电商提供数据分析与社交电商服务。
同时,他也是极客时间《深入浅出计算机组成原理》课程的作者。