极客视点
极客时间编辑部
极客时间编辑部
113230 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/02:26
登录|注册

算法比数据更重要,AlphaGo Zero完胜旧版

讲述:杜力大小:1.11M时长:02:26
日前,谷歌人工智能团队 DeepMind 在期刊《Nature》上发表论文,宣布一款新版的 AlphaGo 计算机程序能够从空白状态起,在不需要任何人类输入的条件下,迅速自学围棋。
这款新程序名为 AlphaGo Zero,它以 100 比 0 的战绩击败了上一代 AlphaGo。这是 AI 历史上又一里程碑式的重大消息。
人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为了打败人类围棋世界冠军,科学家们在训练上一代 AlphaGo 时,同时用到了监督式学习和基于自我对弈的强化学习。监督式学习需要大量的“培训数据”,而 AlphaGo 的数据正是来自此前所有人类棋手的对弈数据。
而 AlphaGo Zero 的学习则是从零开始,并且单纯基于与自己的对弈。人类的输入仅限于棋盘和棋子,没有任何人类数据。它只用到了一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的输赢,在每次自我对弈中不断地迭代进步。
AlphaGo Zero 最大的突破在于实现了“白板理论”。白板理论认为,婴儿是一块白板,可以通过后天学习和训练来提高智力。人工智能 (AI) 的先驱图灵认为,只要能用机器制造一个类似于小孩的 AI,然后加以训练,就能得到一个近似成人智力,甚至超越人类智力的 AI。而自学成才的 AlphaGo Zero 正是实现了这一理论。
这项技术之所以比原本的 AlphaGo 更为强大,是因为它不再受限于人类的知识水平和经验,它可以自己创造知识。
同时,旧版 AlphaGo 的训练过程长达几个月,用到了多台机器和 48 个 TPU(神经网络训练所需的专业芯片)。而新版 AlphaGo Zero 的训练过程只用了 3 天,同时只使用了一台机器和 4 个 TPU。
对此,AlphaGo 的首席研究员戴维·席尔瓦 (David Silver) 表示,人们一般认为机器学习就是关于大数据和海量计算,但是,从 AlphaGo Zero 中可以发现,算法比所谓的计算或数据可用性更为重要。事实上,AlphaGo Zero 使用的计算要比过去的版本少一个数量级,但是因为使用了更多原理和算法,它的性能反而更加强大。
AlphaGo Zero 代表了人工智能一个新的技术节点。在未来,它将可能得到很多引用,成为无数 AI 产业和服务的基础。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • qiang
    谷歌人工智能团队 DeepMind 在期刊《Nature》上发表论文,宣布一款新版的 AlphaGo 计算机程序能够从空白状态起,在不需要任何人类输入的条件下,迅速自学围棋。
收起评论
显示
设置
留言
1
收藏
11
沉浸
阅读
分享
手机端
快捷键
回顶部