AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33454 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

006 | 精读2017年EMNLP最佳短论文

论文的主要贡献
作者群信息
论文的核心观点
A机器人忘记过去的状态
限制词汇数目的方式
发现“语言”并不自然
Q能够以高准确度做出预测
Q和A的模型结构
强化学习模型
两个机器人进行“猜谜”游戏
建立在虚拟的机器人交互场景中
研究目标导向的自动对话系统
探讨多个机器人对话中如何避免产生“非自然”对话
第四作者:德鲁·巴塔(Dhruv Batra)
第三作者:斯特凡·李(Stefan Lee)
第二作者:何塞·毛拉(José M. F. Moura)
第一作者:萨特维克·库托儿(Satwik Kottur)
小结
方法的实验效果
论文的核心方法
论文的主要贡献
作者群信息介绍
EMNLP 2017年最佳短论文《多智能体对话中,自然语言并非“自然”出现》
标题:如何避免机器人产生“非自然”的对话?
参考文章

该思维导图由 AI 生成,仅供参考

在今年的 EMNLP 大会上,有两类研究论文得到发表,一类是 8 页的长研究论文,主要是比较完整的研究结果;另一类是 4 页的短研究论文,主要是比较新的有待进一步推敲的研究结果。大会从长研究论文中选出两篇最佳论文,从短论文中选出一篇最佳论文。
前面我们分别讨论了两篇最佳长论文,今天,我就带你认真剖析一下 EMNLP 2017 年的最佳短论文《多智能体对话中,自然语言并非“自然”出现》(Natural Language Does Not Merge ‘Naturally’ in Multi-Agent Dialog)。我们今天讲的论文虽然是最佳短论文,但是作者们已经在 arXiv 发表了较长的文章版本,因此我今天的讲解将基于 arXiv 的长版本。
这篇文章研究的一个主要命题就是,多个“机器人”(Agent)对话中如何才能避免产生“非自然”(Unnatural)的对话。以前很多机器人对话的研究都关注准确率的高低,但实际上机器人产生的对话是不自然的,人类交流不会用这样的方式。这篇文章希望探讨的就是这样非自然的对话是如何产生的,有没有什么方式避免这样的结果。

作者群信息介绍

第一作者萨特维克·库托儿(Satwik Kottur)来自卡内基梅隆大学,博士第四年,研究领域为计算机视觉、自然语言和机器学习。2016 年暑假他在 Snapchat 的研究团队实习,研究对话系统中的个性化问题。2017 年暑假在 Facebook 研究院实习,做视觉对话系统(Visual Dialog System)的研究。近两年,萨特维克已在多个国际顶级会议如 ICML 2017、IJCAI 2017、CVPR 2017、ICCV 2017 以及 NIPS 2017 发表了多篇高质量研究论文,包括这篇 EMNLP 2017 的最佳短论文,可以说是一颗冉冉升起的学术新星。
第二作者何塞·毛拉(José M. F. Moura)是萨特维克在卡内基梅隆大学的导师。何塞是 NAE(美国国家工程院)院士和 IEEE(电气电子工程师学会)院士,长期从事信号处理以及大数据、数据科学的研究工作。他当选 2018 年 IEEE 总裁,负责 IEEE 下一个阶段的发展。
第三作者斯特凡·李(Stefan Lee)是来自乔治亚理工大学的研究科学家,之前在弗吉尼亚理工大学任职,长期从事计算机视觉、自然语言处理等多方面的研究。斯特凡 2016 年博士毕业于印第安纳大学计算机系。
第四作者德鲁·巴塔(Dhruv Batra)目前是 Facebook 研究院的科学家,也是乔治亚理工大学的助理教授。德鲁 2010 年博士毕业于卡内基梅隆大学;2010 年到 2012 年在位于芝加哥的丰田理工大学担任研究助理教授;2013 年到 2016 年在弗吉尼亚大学任教。德鲁长期从事人工智能特别是视觉系统以及人机交互系统的研究工作。文章的第三作者斯特凡是德鲁长期的研究合作者,他们一起已经发表了包括本文在内的多篇高质量论文。

论文的主要贡献

我们先来看看这篇文章主要解决了一个什么场景下的问题。
人工智能的一个核心场景,或者说想要实现的一个目标,就是能够建立一个目标导向(Goal-Driven)的自动对话系统(Dialog System)。具体来说,在这样的系统中,机器人能够感知它们的环境(包括视觉、听觉以及其他感官),然后能和人或者其他机器人利用自然语言进行对话,从而实现某种目的。
目前对目标导向的自动对话系统的研究主要有两种思路。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

《多智能体对话中,自然语言并非“自然”出现》是EMNLP 2017年的最佳短论文,探讨了多个机器人对话中如何避免产生“非自然”对话的问题。研究团队通过虚拟机器人交互场景的模拟,利用强化学习方法建模机器人之间的对话过程。他们发现自然语言并非自然出现,而是一个尚未确定答案的开放问题。文章的主要贡献在于探讨了目标导向的自动对话系统中的语言生成问题,并提出了一种新的研究思路。核心方法是通过强化学习模型对机器人之间的对话进行建模,包括“听”、“说”和“预测”三个模块,以及使用REINFORCE算法来学习参数。研究成果为目标导向的自动对话系统的发展提供了新的思路和方法。在实验中,作者们展示了在限制词汇量和无记忆约束下,机器人对话可以呈现出一定的自然语言特征,取得了显著的效果。这篇论文突破了以往从预测准确度出发分析对话系统的传统思路,而是从谈话的自然程度出发,为改进机器人对话系统的自然语言生成能力提供了重要的指导意义。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(5)

  • 最新
  • 精选
  • 黄德平
    理论上来讲,真实场景同样是个有限场景,有限个具象或抽象的物体,有限个属性,词汇量应该是伴随着人们能够接触到的物体数量缓慢增加的,而且增长速度慢于物体增加的速度。因为先发明的词汇通过叠加的方式可能可以描述新的物体,只有需要很长老词汇才能描述新物体时才有必要发明新词汇,而且是在新物体足够常见值得用一个新词描述的情况下。个人认为可以用一个简单公式描述,描述物体的总数是一个系数乘以词汇量的平方,比如一共一亿个物体,我只需要几万个词汇,我认为组合其中的某两个词汇足够表达新物体。
    2018-12-16
    3
  • 深白浅黑
    人机交互中机器人语言缺乏自然语言特征,可以使用强化学习模式来进行改进。通过降低词库数量将解决内部信息以编码形式输出的情况,通过忘记过去状态解决属性叠加的判断,使对话呈现出自然语言叠加特性特征。
    2019-09-10
    1
  • 韩 * *
    个人理解:人类“自然”的对话传递信息的“速率”是有限的,限制“速率”有利于产生在人类主观看来更“自然”的信息交互过程。
    2019-08-13
    1
  • 小南
    这就像是学习一门语言,如何判断我有足够的语言基底把想要表达的事情讲明白呢?
    2021-08-12
  • 元初
    感觉在自然的语言中,越是日常的对话每句话的关键信息越少,分布越稀疏,感觉像是为了隐晦自己的目的,让自己在人际交往中说话不太突兀;而随着关键信息的密集程度上升,文字就向官方声明靠近,到达那种每一个定语的差异都带来语义的显著变化就是顶峰了(没错就是政治背书的感悟);再往上就不自然了,是不是可以控制语句信息量来实现自然化呢
    2021-04-16
收起评论
显示
设置
留言
5
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部