内容介绍

Apache Spark 作为最火的大规模数据处理引擎之一，进步神速，它不仅在互联网公司，在传统行业（如银行）的使用都非常广泛。随着云时代的到来，把 Spark 搬到云上这件事，主要的云服务提供商都在做，比如 AWS/Aliyun 的 EMR、华为云的 MRS，但这种模式有几个缺点：对中小规模用户，成本上浪费严重，管控节点开销占比过高；和其他云服务接入很生硬，大多数需要用户自己开发；集群和作业调优需要用户自己来做，除非够大，否则不会有专业团队贴脸服务。

Serverless 化的 Spark 服务是解决问题的王道，但是开源版本的 Spark 在企业级功能、规模、安全性、成本等方面颇有差距，这次分享主要站在云计算实践者的角度来分析这些差距都是什么和解决办法。

演讲大纲

Serverless VS E-MapReduce；
规模和可扩展性；
用户代码和系统安全；
数据湖存储架构；
企业级特性；
硬件的使用；
和 Carbon 存储系统的集成；
细节决定成败。

展开



¥4.99 购买

开通VIP







登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论

其他推荐

43:27

数字化转型提升企业核心竞争力——“云”会吞噬一切

乔新亮环球易购 CTO，前苏宁科技集团副总裁，TGO 鲲鹏会荣誉导师

试看

34:44

大规模 GPU 虚拟化技术在讯飞 AI 业务中的应用

徐瑞晨科大讯飞虚拟化团队负责人

试看

45:34

中小互联网公司如何落地云安全

白嘎力 Rokid信息安全总监

试看