极客视点
极客时间编辑部
极客时间编辑部
113234 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/02:07
登录|注册

ARM发布第一代AI架构“Trillium”

讲述:杜力大小:992.31K时长:02:07
近日,ARM 展示了其第一代机器学习处理器,预计今年晚些时候,ARM 的合作伙伴就可以使用其 IP,架构名为“Trillium”,它吸收了从硬件、数据压缩和编译器方面最成功的创新中的优点。
对于那些需要英伟达 Volta GPU 的 TensorCore 功能的人来说,ARM 这款处理器可能意义重大,比如 DeePhi 神经网络压缩技术(现在是 Xilinx 的一部分)、FPGA 的可编程性,以及 DSP 的低功耗处理能力。
ARM 的技术总监伊恩·布拉特(Ian Bratt)表示,ARM 首次涉足 AI 处理器的目标是尽可能的推广,以便能够满足服务器端 AI 的市场需求,并将自家 AI 处理器更多的用于汽车和具有物联网需求的小型设备上。
值得注意的是,该架构吸收了从硬件、压缩和编译器方面最成功的优点。其中,MAC 引擎(与英伟达的 TensorCore 不同)是执行卷积化的地方,可编程层引擎负责处理网络各层之间的大部分必要的 shuffling。
另外,ARM 芯片还具备可编程层引擎,它使用 Cortex CPU 技术来支持非卷积运算符,以及向量和神经网络扩展。
与某些 AI 专用处理器相比,ARM 处理器增加了高带宽内存(HMC),可能使其更容易识别,但是需要授权用户了解这些组件系统中协同工作的方式。 同时,ARM 工程师从生态系统中汲取了最佳的 AI 处理器技术,并使用开源软件挂钩,可能大幅扩大授权的许可范围。
对于一家以创新为基础的公司而言,ARM 正在走一条自己的独特道路。他们在用于神经网络的点积(dot product)引擎上做出了一些关键性创新,提升了执行效率、降低了网络噪音。
总体而言,不用高速缓存、精简压缩流程、使用混合精度算法,并与精简化的 SRAM 片上计算相结合,将其移植到密集的点积引擎上,这些都使得 ARM 的芯片成为市场上引人注目的焦点,而且可以针对关键的工作负载做进一步的细化。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
8
沉浸
阅读
分享
手机端
快捷键
回顶部