极客视点
极客时间编辑部
极客时间编辑部
113240 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/02:17
登录|注册

AWS宣布推出AI芯片Inferentia

讲述:丁婵大小:2.08M时长:02:17
近日,在 re:Invent 大会上,AWS 发布了一款专门为机器学习设计的新型处理器芯片,又一次印证了这家公司在云计算领域雄心勃勃。
这款芯片名为 Inferentia,将通过 AWS 的 EC2 计算服务以及 SageMaker AI 服务和 Amazon Elastic Inference 来提供。该芯片旨在加快由机器学习模型执行的推理或预测过程,帮助支持亚马逊的 Alexa 等服务和自动驾驶汽车。
据了解,该芯片与图形处理单元(GPU,主要是英伟达的芯片)相比,具有延迟低、成本效益高的优点,近些年来 GPU 一直是机器学习的首选芯片。
这款芯片预计将于明年上市,AWS 首席执行官安迪·杰西表示,它与多种类型的数据和所有主要的框架(比如 PyTorch、TensorFlow 和 MXNet)兼容,还将提供每秒数百万亿次运算(TOPS),多个结合起来可以达到每秒数千万亿次运算的性能。
事实上,这款芯片是 AWS 在近日内宣布的第二款芯片。同时推出的还有 Graviton 芯片,该芯片可以通过 AWS 的 EC2 云计算服务提供给其云客户。
市场研究机构 Strategy 的总裁兼首席分析师帕特里克·穆尔黑德(Patrick Moorhead)表示,AWS 宣布开发自己的芯片,这个举动意义重大。与谷歌云不同,AWS 的服务使用更加广泛,并且具有弹性。针对推理这种应用,AWS 现在提供了 CPU、GPU、FPGA 以及自己的 ASIC。
AWS 计划向客户提供 Inferentia,但是它与谷歌的产品全然不同。不像 TPU 是为训练机器学习模型而设计的,它是为推理而设计的,而推理是系统在训练结束后所做的决策。
此外,亚马逊还宣布推出 Elastic Inference,这是一种由 GPU 提供支持的深度学习推理加速服务。杰西表示,通过为客户提供配置实际需要的 AWS 计算实例这种方案,可以将处理推理任务的成本最多节省 75%。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
3
沉浸
阅读
分享
手机端
快捷键
回顶部