算法比数据更重要,AlphaGo Zero完胜旧版
极客时间编辑部
讲述:杜力大小:1.11M时长:02:26
日前,谷歌人工智能团队 DeepMind 在期刊《Nature》上发表论文,宣布一款新版的 AlphaGo 计算机程序能够从空白状态起,在不需要任何人类输入的条件下,迅速自学围棋。
这款新程序名为 AlphaGo Zero,它以 100 比 0 的战绩击败了上一代 AlphaGo。这是 AI 历史上又一里程碑式的重大消息。
人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为了打败人类围棋世界冠军,科学家们在训练上一代 AlphaGo 时,同时用到了监督式学习和基于自我对弈的强化学习。监督式学习需要大量的“培训数据”,而 AlphaGo 的数据正是来自此前所有人类棋手的对弈数据。
而 AlphaGo Zero 的学习则是从零开始,并且单纯基于与自己的对弈。人类的输入仅限于棋盘和棋子,没有任何人类数据。它只用到了一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的输赢,在每次自我对弈中不断地迭代进步。
AlphaGo Zero 最大的突破在于实现了“白板理论”。白板理论认为,婴儿是一块白板,可以通过后天学习和训练来提高智力。人工智能 (AI) 的先驱图灵认为,只要能用机器制造一个类似于小孩的 AI,然后加以训练,就能得到一个近似成人智力,甚至超越人类智力的 AI。而自学成才的 AlphaGo Zero 正是实现了这一理论。
这项技术之所以比原本的 AlphaGo 更为强大,是因为它不再受限于人类的知识水平和经验,它可以自己创造知识。
同时,旧版 AlphaGo 的训练过程长达几个月,用到了多台机器和 48 个 TPU(神经网络训练所需的专业芯片)。而新版 AlphaGo Zero 的训练过程只用了 3 天,同时只使用了一台机器和 4 个 TPU。
对此,AlphaGo 的首席研究员戴维·席尔瓦 (David Silver) 表示,人们一般认为机器学习就是关于大数据和海量计算,但是,从 AlphaGo Zero 中可以发现,算法比所谓的计算或数据可用性更为重要。事实上,AlphaGo Zero 使用的计算要比过去的版本少一个数量级,但是因为使用了更多原理和算法,它的性能反而更加强大。
AlphaGo Zero 代表了人工智能一个新的技术节点。在未来,它将可能得到很多引用,成为无数 AI 产业和服务的基础。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- qiang谷歌人工智能团队 DeepMind 在期刊《Nature》上发表论文,宣布一款新版的 AlphaGo 计算机程序能够从空白状态起,在不需要任何人类输入的条件下,迅速自学围棋。
收起评论