AI技术内参
洪亮劼
Etsy数据科学主管,前雅虎研究院资深科学家
立即订阅
8406 人已学习
课程目录
已完结 166 讲
0/6登录后,你可以任选6讲全文学习。
开篇词 (1讲)
开篇词 | 你的360度人工智能信息助理
免费
人工智能国际顶级会议 (15讲)
001 | 聊聊2017年KDD大会的时间检验奖
002 | 精读2017年KDD最佳研究论文
003 | 精读2017年KDD最佳应用数据科学论文
004 | 精读2017年EMNLP最佳长论文之一
005 | 精读2017年EMNLP最佳长论文之二
006 | 精读2017年EMNLP最佳短论文
007 | 精读2017年ICCV最佳研究论文
008 | 精读2017年ICCV最佳学生论文
009 | 如何将“深度强化学习”应用到视觉问答系统?
010 | 精读2017年NIPS最佳研究论文之一:如何解决非凸优化问题?
011 | 精读2017年NIPS最佳研究论文之二:KSD测试如何检验两个分布的异同?
012 | 精读2017年NIPS最佳研究论文之三:如何解决非完美信息博弈问题?
013 | WSDM 2018论文精读:看谷歌团队如何做位置偏差估计
014 | WSDM 2018论文精读:看京东团队如何挖掘商品的替代信息和互补信息
015 | WSDM 2018论文精读:深度学习模型中如何使用上下文信息?
搜索核心技术 (28讲)
031 | 经典搜索核心算法:TF-IDF及其变种
032 | 经典搜索核心算法:BM25及其变种(内附全年目录)
033 | 经典搜索核心算法:语言模型及其变种
034 | 机器学习排序算法:单点法排序学习
035 | 机器学习排序算法:配对法排序学习
036 | 机器学习排序算法:列表法排序学习
037 | “查询关键字理解”三部曲之分类
038 | “查询关键字理解”三部曲之解析
039 | “查询关键字理解”三部曲之扩展
040 | 搜索系统评测,有哪些基础指标?
041 | 搜索系统评测,有哪些高级指标?
042 | 如何评测搜索系统的在线表现?
043 | 文档理解第一步:文档分类
044 | 文档理解的关键步骤:文档聚类
045 | 文档理解的重要特例:多模文档建模
046 | 大型搜索框架宏观视角:发展、特点及趋势
047 | 多轮打分系统概述
048 | 搜索索引及其相关技术概述
049 | PageRank算法的核心思想是什么?
050 | 经典图算法之HITS
051 | 社区检测算法之“模块最大化 ”
052 | 机器学习排序算法经典模型:RankSVM
053 | 机器学习排序算法经典模型:GBDT
054 | 机器学习排序算法经典模型:LambdaMART
055 | 基于深度学习的搜索算法:深度结构化语义模型
056 | 基于深度学习的搜索算法:卷积结构下的隐含语义模型
057 | 基于深度学习的搜索算法:局部和分布表征下的搜索模型
复盘 1 | 搜索核心技术模块
推荐系统核心技术 (22讲)
058 | 简单推荐模型之一:基于流行度的推荐模型
059 | 简单推荐模型之二:基于相似信息的推荐模型
060 | 简单推荐模型之三:基于内容信息的推荐模型
061 | 基于隐变量的模型之一:矩阵分解
062 | 基于隐变量的模型之二:基于回归的矩阵分解
063 | 基于隐变量的模型之三:分解机
064 | 高级推荐模型之一:张量分解模型
065 | 高级推荐模型之二:协同矩阵分解
066 | 高级推荐模型之三:优化复杂目标函数
067 | 推荐的Exploit和Explore算法之一:EE算法综述
068 | 推荐的Exploit和Explore算法之二:UCB算法
069 | 推荐的Exploit和Explore算法之三:汤普森采样算法
070 | 推荐系统评测之一:传统线下评测
071 | 推荐系统评测之二:线上评测
072 | 推荐系统评测之三:无偏差估计
073 | 现代推荐架构剖析之一:基于线下离线计算的推荐架构
074 | 现代推荐架构剖析之二:基于多层搜索架构的推荐系统
075 | 现代推荐架构剖析之三:复杂现代推荐架构漫谈
076 | 基于深度学习的推荐模型之一:受限波兹曼机
077 | 基于深度学习的推荐模型之二:基于RNN的推荐系统
078 | 基于深度学习的推荐模型之三:利用深度学习来扩展推荐系统
复盘 2 | 推荐系统核心技术模块
广告系统核心技术 (0讲)
该章节暂未更新内容,敬请期待
自然语言处理及文本处理核心技术 (17讲)
097 | LDA模型的前世今生
098 | LDA变种模型知多少
099 | 针对大规模数据,如何优化LDA算法?
100 | 基础文本分析模型之一:隐语义分析
101 | 基础文本分析模型之二:概率隐语义分析
102 | 基础文本分析模型之三:EM算法
103 | 为什么需要Word2Vec算法?
104 | Word2Vec算法有哪些扩展模型?
105 | Word2Vec算法有哪些应用?
106 | 序列建模的深度学习利器:RNN基础架构
107 | 基于门机制的RNN架构:LSTM与GRU
108 | RNN在自然语言处理中有哪些应用场景?
109 | 对话系统之经典的对话模型
110 | 任务型对话系统有哪些技术要点?
111 | 聊天机器人有哪些核心技术要点?
112 | 什么是文档情感分类?
113 | 如何来提取情感“实体”和“方面”呢?
计算机视觉核心技术 (0讲)
该章节暂未更新内容,敬请期待
数据科学家与数据科学团队养成 (15讲)
127 | 数据科学家基础能力之概率统计
128 | 数据科学家基础能力之机器学习
129 | 数据科学家基础能力之系统
130 | 数据科学家高阶能力之分析产品
131 | 数据科学家高阶能力之评估产品
132 | 数据科学家高阶能力之如何系统提升产品性能
133 | 职场话题:当数据科学家遇见产品团队
134 | 职场话题:数据科学家应聘要具备哪些能力?
135 | 职场话题:聊聊数据科学家的职场规划
136 | 如何组建一个数据科学团队?
137 | 数据科学团队养成:电话面试指南
138 | 数据科学团队养成:Onsite面试面面观
139 | 成为“香饽饽”的数据科学家,如何衡量他们的工作呢?
140 | 人工智能领域知识体系更新周期只有5~6年,数据科学家如何培养?
141 | 数据科学家团队组织架构:水平还是垂直,这是个问题
热点话题讨论 (2讲)
151 | 精读AlphaGo Zero论文
152 | 2017人工智能技术发展盘点
结束语 (0讲)
该章节暂未更新内容,敬请期待
AI技术内参
登录|注册

006 | 精读2017年EMNLP最佳短论文

洪亮劼 2017-11-10

在今年的 EMNLP 大会上,有两类研究论文得到发表,一类是 8 页的长研究论文,主要是比较完整的研究结果;另一类是 4 页的短研究论文,主要是比较新的有待进一步推敲的研究结果。大会从长研究论文中选出两篇最佳论文,从短论文中选出一篇最佳论文。

前面我们分别讨论了两篇最佳长论文,今天,我就带你认真剖析一下 EMNLP 2017 年的最佳短论文《多智能体对话中,自然语言并非“自然”出现》(Natural Language Does Not Merge ‘Naturally’ in Multi-Agent Dialog)。我们今天讲的论文虽然是最佳短论文,但是作者们已经在 arXiv 发表了较长的文章版本,因此我今天的讲解将基于 arXiv 的长版本。

这篇文章研究的一个主要命题就是,多个“机器人”(Agent)对话中如何才能避免产生“非自然”(Unnatural)的对话。以前很多机器人对话的研究都关注准确率的高低,但实际上机器人产生的对话是不自然的,人类交流不会用这样的方式。这篇文章希望探讨的就是这样非自然的对话是如何产生的,有没有什么方式避免这样的结果。

作者群信息介绍

第一作者萨特维克·库托儿(Satwik Kottur)来自卡内基梅隆大学,博士第四年,研究领域为计算机视觉、自然语言和机器学习。2016 年暑假他在 Snapchat 的研究团队实习,研究对话系统中的个性化问题。2017 年暑假在 Facebook 研究院实习,做视觉对话系统(Visual Dialog System)的研究。近两年,萨特维克已在多个国际顶级会议如 ICML 2017、IJCAI 2017、CVPR 2017、ICCV 2017 以及 NIPS 2017 发表了多篇高质量研究论文,包括这篇 EMNLP 2017 的最佳短论文,可以说是一颗冉冉升起的学术新星。

第二作者何塞·毛拉(José M. F. Moura)是萨特维克在卡内基梅隆大学的导师。何塞是 NAE(美国国家工程院)院士和 IEEE(电气电子工程师学会)院士,长期从事信号处理以及大数据、数据科学的研究工作。他当选 2018 年 IEEE 总裁,负责 IEEE 下一个阶段的发展。

第三作者斯特凡·李(Stefan Lee)是来自乔治亚理工大学的研究科学家,之前在弗吉尼亚理工大学任职,长期从事计算机视觉、自然语言处理等多方面的研究。斯特凡 2016 年博士毕业于印第安纳大学计算机系。

第四作者德鲁·巴塔(Dhruv Batra)目前是 Facebook 研究院的科学家,也是乔治亚理工大学的助理教授。德鲁 2010 年博士毕业于卡内基梅隆大学;2010 年到 2012 年在位于芝加哥的丰田理工大学担任研究助理教授;2013 年到 2016 年在弗吉尼亚大学任教。德鲁长期从事人工智能特别是视觉系统以及人机交互系统的研究工作。文章的第三作者斯特凡是德鲁长期的研究合作者,他们一起已经发表了包括本文在内的多篇高质量论文。

论文的主要贡献

我们先来看看这篇文章主要解决了一个什么场景下的问题。

人工智能的一个核心场景,或者说想要实现的一个目标,就是能够建立一个目标导向(Goal-Driven)的自动对话系统(Dialog System)。具体来说,在这样的系统中,机器人能够感知它们的环境(包括视觉、听觉以及其他感官),然后能和人或者其他机器人利用自然语言进行对话,从而实现某种目的。

目前对目标导向的自动对话系统的研究主要有两种思路。

© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《AI技术内参》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(3)

  • 黄德平
    理论上来讲,真实场景同样是个有限场景,有限个具象或抽象的物体,有限个属性,词汇量应该是伴随着人们能够接触到的物体数量缓慢增加的,而且增长速度慢于物体增加的速度。因为先发明的词汇通过叠加的方式可能可以描述新的物体,只有需要很长老词汇才能描述新物体时才有必要发明新词汇,而且是在新物体足够常见值得用一个新词描述的情况下。个人认为可以用一个简单公式描述,描述物体的总数是一个系数乘以词汇量的平方,比如一共一亿个物体,我只需要几万个词汇,我认为组合其中的某两个词汇足够表达新物体。
    2018-12-16
    1
  • 深白浅黑
    人机交互中机器人语言缺乏自然语言特征,可以使用强化学习模式来进行改进。通过降低词库数量将解决内部信息以编码形式输出的情况,通过忘记过去状态解决属性叠加的判断,使对话呈现出自然语言叠加特性特征。
    2019-09-10
  • 韩 * *
    个人理解:人类“自然”的对话传递信息的“速率”是有限的,限制“速率”有利于产生在人类主观看来更“自然”的信息交互过程。
    2019-08-13
收起评论
3
返回
顶部