AWS宣布推出AI芯片Inferentia
极客时间编辑部
讲述:丁婵大小:2.08M时长:02:17
近日,在 re:Invent 大会上,AWS 发布了一款专门为机器学习设计的新型处理器芯片,又一次印证了这家公司在云计算领域雄心勃勃。
这款芯片名为 Inferentia,将通过 AWS 的 EC2 计算服务以及 SageMaker AI 服务和 Amazon Elastic Inference 来提供。该芯片旨在加快由机器学习模型执行的推理或预测过程,帮助支持亚马逊的 Alexa 等服务和自动驾驶汽车。
据了解,该芯片与图形处理单元(GPU,主要是英伟达的芯片)相比,具有延迟低、成本效益高的优点,近些年来 GPU 一直是机器学习的首选芯片。
这款芯片预计将于明年上市,AWS 首席执行官安迪·杰西表示,它与多种类型的数据和所有主要的框架(比如 PyTorch、TensorFlow 和 MXNet)兼容,还将提供每秒数百万亿次运算(TOPS),多个结合起来可以达到每秒数千万亿次运算的性能。
事实上,这款芯片是 AWS 在近日内宣布的第二款芯片。同时推出的还有 Graviton 芯片,该芯片可以通过 AWS 的 EC2 云计算服务提供给其云客户。
市场研究机构 Strategy 的总裁兼首席分析师帕特里克·穆尔黑德(Patrick Moorhead)表示,AWS 宣布开发自己的芯片,这个举动意义重大。与谷歌云不同,AWS 的服务使用更加广泛,并且具有弹性。针对推理这种应用,AWS 现在提供了 CPU、GPU、FPGA 以及自己的 ASIC。
AWS 计划向客户提供 Inferentia,但是它与谷歌的产品全然不同。不像 TPU 是为训练机器学习模型而设计的,它是为推理而设计的,而推理是系统在训练结束后所做的决策。
此外,亚马逊还宣布推出 Elastic Inference,这是一种由 GPU 提供支持的深度学习推理加速服务。杰西表示,通过为客户提供配置实际需要的 AWS 计算实例这种方案,可以将处理推理任务的成本最多节省 75%。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论