极客视点
极客时间编辑部
极客时间编辑部
113243 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/04:27
登录|注册

谷歌如何利用AI在六小时内设计一款芯片?

讲述:初明明大小:4.07M时长:04:27
你好,欢迎收听极客视点。
一直以来,芯片都是不少科技公司研发的重点,尤其在芯片市场竞争异常火热的今天。谷歌虽然依靠软件立身,但近些年却也一直在钻研芯片技术,TPU 就是一个不错的成果。近日,Google AI 负责人 Jeff Dean 在一篇预发表论文中,公布了一种基于机器学习的芯片设计方法,声称可以将设计流程缩减到 6 个小时,而常规的芯片设计往往需要数周甚至更久。InfoQ对其进行了 翻译,如下。
虽然这款号称 6 个小时之内就能设计完成的芯片并不算是什么全新思路,但其真正实现源自今年 3 月谷歌工程师们在最新论文中提出的技术。更重要的是,这也表明处理器芯片上的晶体管排布设计将在很大程度上实现自动化。
在去年底接受采访时,Dean 解释道:“基本上,以往的设计流程就是由研究人员利用一系列设计工具完成布局决策。听起来简单,但实际上布局与布线专家们需要使用这些工具进行一次又一次设计迭代。从初步设计,到将布局物理铺设在实体芯片上,到满足芯片项目的尺寸、功率与导线长度限制,再到符合所有协同设计师思路乃至现有制造工艺……这将是一个延续数周的艰辛过程。而现在,我们可以构建起一套机器学习模型,由其学习特定芯片中的布局与布线规则,最终快速生成可行的设计方案。”
随着训练的推进,针对该芯片的训练方式也发生了变化,左图为从零开始进行的训练策略,右图则为针对该芯片功能的预训练策略。每个矩形代表一个独立的宏放置位。论文作者们提出的方法,是将逻辑门、存储器等“排线表列”放置在芯片底板上,从而在优化功率、性能与面积(PPA)指标的同时,遵循当前芯片项目对于布局及布线密度的硬性要求。设计流程的规模范围非常灵活,从数百万节点到数十亿节点(这些节点将被归类至成千上万个簇内)皆可涵盖。一般来说,评估既定指标往往需要数小时到一天的时间。
研究人员还设计出一套框架,负责指导经过强化学习训练的代理优化芯片布局。(强化学习代理通过奖励摸索出最佳目标实现方式;在芯片设计案例中,代理将不断学习各类放置策略,探索如何实现奖励最大化。)在排线表列固定的前提下,AI 策略模型会根据当前节点 ID/ 排线表列以及半导体制造工艺等因素输出可行的芯片单元排布概率结果,并由估值模型估算当前放置方案的预期收益。
在实践当中,代理会在空芯片上依次放置组件,直到完成排线表列中的所有条目为止。更重要的是,只有代理的波长(与功率及性能相关)负加权总和与拥塞度(受排线密度限制)为负值时才会得到奖励。为了引导代理找出需要首先放置的组件,研究人员对组件按大小递减次序进行排序;首先放置较大组件,能够降低后续缺少充足放置空间的问题。
要完成代理训练,研究人员需要创建一套包含 10000 种芯片布局的数据集,其中的输入内容为匹配特定放置要求的具体状态,标签则为放置奖励(即导线长度与拥塞度)。为了创建这套数据集,研究人员们首先选择了一种不同的芯片排线表列,而后利用 AI 算法为每种表列生成 2000 种不同的布局。
根据作者们的说明,他们在实验中发现,随着整体框架训练度的不断提升,训练速度开始持续加快并产出质量更高的结果。具体来看,与当前领先的基准水平相比,这项新技术在谷歌张量处理单元(TPU,由谷歌定制设计的 AI 加速器芯片)设计中带来了非常出色的 PPA 指标。
研究人员称,与当前从零开始为每一款新芯片优化布局设计的方法不同,他们的工作能够利用以往芯片设计经验加快设计速度,并随时间推移不断强化设计质量。此外,这种新方法也能够直接优化特定指标,例如导线长度、密度与拥塞度等等,这就摆脱了传统方法中硬性定义相关指标近似值的局限。这套新方案不仅极大降低了芯片设计中的成本控制难度,同时也可以根据特定芯片的实际需求衡量不同指标的相对重要程度。
以上就是今天的内容,希望对你有所帮助。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
10
沉浸
阅读
分享
手机端
快捷键
回顶部