PlinyCompute:开发高性能大数据代码
极客时间编辑部
讲述:丁婵大小:1.15M时长:02:30
近日,赖斯大学的科研团队推出了 PlinyCompute,这是一种专门用于开发高性能大数据代码的系统。
程序员往往在精疲力竭时,还竭力在 Spark 这样的‘大数据’平台上进行复杂的工作流程,为了解决这一现象,在工作流程中找到更好的方法,赖斯大学的科研团队提出了 PlinyCompute。
负责领导开发该平台的计算机科学教授克里斯·杰梅恩(Chris Jermaine)表示,PlinyCompute 与 Spark 相同的是,它们都力求易于使用、用途广泛的特性。但是与 Spark 不一样的是,PlinyCompute 旨在支持以前只有超级计算机或高性能计算机(HPC)才能实现的强大计算。
据介绍,Spark 是为大数据构建的,它可以支持高性能计算机无法支持的特性,比如简易的负载均衡、容错和资源分配等,这对于数据密集型任务来说是必不可少的。
曾经在 IBM 研究中国院进行了六年研究的邹佳表示,PlinyCompute 与 Spark 不一样,因为它完全是为高性能而设计的。在基准测试中发现,PlinyCompute 的速度至少是 Spark 的两倍;在一些情况下,PlinyCompute 实现复杂对象处理和库式计算的速度比 Spark 快 50 倍。
她表示,PlinyCompute 在构建高性能工具和库方面比同类工具更胜一筹。
另外,据杰梅恩介绍,不是所有的程序员都觉得为 PlinyCompute 编写代码很容易,因为它的库和模型必须用 C ++ 编写。
PlinyCompute 具有很大的灵活性,对于那些对 C ++ 的经验和知识相对缺乏的人来说,这可能是一个挑战,但是在对完成各种实现所需要的代码行数进行横向比较之后,结果发现,在大多数情况下,PlinyCompute 和 Spark 之间没有显著差异。
杰梅恩表示,PlinyCompute 是一种计算复杂的机器学习应用,实际上,目前还没有一个好的工具来构建它。PlinyCompute 可以解决的问题,远比用 Pliny 项目来解决的问题广泛得多。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论