阿里重磅开源首款自研科学计算引擎Mars
极客时间编辑部
讲述:丁婵大小:2.20M时长:02:25
近日,阿里巴巴正式对外发布了分布式科学计算引擎 Mars,突破了现有大数据计算引擎的关系代数为主的计算模型,将分布式技术引入科学计算 / 数值计算领域,极大地扩展了科学计算的计算规模和效率。目前已经应用于阿里巴巴及其云上客户的业务和生产场景。
现如今,机器学习 / 深度学习的热潮席卷而来,张量的概念已经逐渐为人所熟知,对张量进行通用计算的规模需求也与日俱增。但现实是,像 Numpy 这样优秀的科学计算库仍然停留在单机时代,无法突破规模瓶颈。当下流行的分布式计算引擎也并非为科学计算而生,上层接口不匹配导致科学计算任务很难用传统的 SQL/MapReduce 编写,执行引擎本身没有针对科学计算优化,更使得计算效率难以令人满意。
因此,基于以上科学计算的现状,由阿里巴巴统一大数据计算平台 MaxCompute 研发团队,历经一年多研发,打破了大数据、科学计算领域边界,完成第一个版本并开源。
据了解,Mars 通过 tensor 模块提供了兼容 Numpy 的接口,用户可以将已有的基于 Numpy 编写的代码,只需要替换 import,就可以将代码逻辑移植到 Mars,并直接获得比原来大数万倍规模、同时处理能力提高数十倍的能力。目前,Mars 实现了大约 70% 的常见 Numpy 接口。
除此之外,Mars 还扩展了 Numpy,充分利用了 GPU 在科学计算领域的已有成果。Mars 还支持二维稀疏矩阵,在创建稀疏矩阵的时候,通过指定 sparse=True 即可。
作为新一代超大规模科学计算引擎,Mars 不仅使科学计算进入分布式时代,更让大数据进行高效的科学计算成为可能。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论