阿里、MSRA机器阅读能力超越人类
极客时间编辑部
讲述:杜力大小:1.18M时长:02:35
近日,在斯坦福大学发起的 SQuAD(Stanford Question Answering Dataset)文本理解挑战赛上,以阿里巴巴、微软亚洲研究院(MSRA)为代表的中国研究团队,相继刷新了 SQuAD 纪录,阿里巴巴与微软亚洲研究院并列 SQuAD 榜单的第一名,机器阅读能力的准确率首次超越人类。
SQuAD 是行业内公认的机器阅读理解领域的顶级水平测试,它构建了一个包含十万个问题的大规模机器阅读理解数据集,选取超过 500 篇维基百科文章。机器在阅读数据集内的文章后,需要回答若干与文章内容相关的问题,并通过与标准答案的比对,得到精确匹配 EM(Exact Match,预测答案和真实答案完全匹配)和模糊匹配 F1(F1-score,评测模型的整体性能)的结果。
在此次挑战赛中,阿里巴巴团队于 2018 年 1 月 5 日提交的 SLQA+ 在 EM 值上获得了 82.440 的优秀成绩,F1 值则为 88.607。
而微软亚洲研究院自然语言计算组于 1 月 3 日提交的 R-NET 模型在 EM 值上获得了 82.650 的成绩,在 F1 值上的表现为 88.493 。
两个团队的 EM 值成绩都超越了人类的 82.304 分,这也标志着,机器阅读理解准确率超越人类这一目标,在 2018 年已经成为现实。
机器阅读理解技术拥有广阔的应用场景,比如在精准问答上能为用户提供极大的帮助,另外,它也能推动很多 NLP 相关领域的进步,如知识的表示、上下文篇章理解、知识推理等。
阿里巴巴自然语言处理首席科学家司罗表示,未来希望能向终极目标迈进,即机器对通用内容真正能理解会思考。
据了解,阿里巴巴能够在 SQuAD 的榜单上获得第一,主要得益于其提出的“基于分层融合注意力机制“的深度神经网络模型,这一模型能够模拟人类在阅读理解中所产生的行为,包括审题、带着问题阅读文章,对文章进行标注等。
目前,这一技术已被应用于阿里内部,例如顾客在双十一期间对活动规则进行咨询,阿里小蜜通过机器阅读理解技术,帮助顾客进行相关问题的解答。同时,这一技术还能够帮助顾客阅读商品详情页,智能提取信息,为顾客直接解答基础问题等。
而微软亚洲研究院 R-NET 的技术细节,可以理解为一个多层的网络结构,对整个阅读理解任务的算法进行建模,具体包括阅读文章及审题;寻找问题与文中内容的关联,综合全文进行验证;精筛,选出正确答案等步骤。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 嚴脂红.*👍👍👍
收起评论