057 | 基于深度学习的搜索算法:局部和分布表征下的搜索模型
洪亮劼
该思维导图由 AI 生成,仅供参考
周一我们分享了一篇较早利用深度学习技术来进行搜索建模的论文,利用前馈神经网络来对查询关键字和文档进行信息提取,从而学习到更有意义的语义信息。周三我们分享了另外一篇论文,可以说是周一分享文章的一个后续工作,探讨了如何利用卷积神经网络来对搜索表征进行进一步提升。这两篇论文呈现了一个统一的套路,那就是尝试把深度学习的一些经验直接应用到传统的搜索建模上。这些尝试,也都取得了一些初步成绩。
今天我们来聊一篇 2017 年刚刚发表的论文《网页搜索中利用文本的局部和分布表征学习匹配》(Learning to Match Using Local and Distributed Representations of Text for Web Search),这是近期将深度学习模型应用在搜索领域的一个创新。这篇论文发表在世界万维网大会 WWW 2017 上。
论文背景介绍
下面我们来了解一下这篇论文的作者群信息。
第一作者巴斯卡⋅米特拉(Bhaskar Mitra)是微软研究院在剑桥实验室的一名研究员。他已经发表了多篇利用深度学习技术解决搜索问题的论文。目前,米特拉在伦敦大学学院攻读博士学位。
第二作者是费尔南多⋅迪亚兹(Fernando Diaz)在文章发表的时候是微软研究院的一名研究员,目前则在 Spotify 工作。迪亚兹长期从事搜索以及信息检索的工作,发表多篇论文,文章总引用数超过三千次。加入微软之前,他曾经在雅虎研究院从事过研究工作。
文章的第三作者尼克⋅克拉维尔(Nick Craswell)在微软研究院工作,目前是主任级研发经理,长期从事搜索和信息检索的研究,发表多篇论文,文章总引用数达 8 千多次。
局部和分布表征下的搜索模型详解
我们详细讲讲这篇论文的核心思想。要想理解这篇论文提出的思路,我们首先要简单回顾一下这周讲的前两篇文章内容。
本周第一篇介绍的深度结构化语义模型主要是希望利用前馈神经网络来对查询关键字和文档进行信息提取。第二篇文章尝试用卷积神经网络来提取查询关键字和文档的信息。
不论是前馈网络,还是卷积网络, 这些尝试都是想从文本中提取高层次的语义信息。那么今天这篇文章说得是,并不是所有的相关信息都是高层次的语义信息。这是什么意思呢?
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
这篇文章介绍了一种新的搜索建模方法,利用深度学习技术对文本的局部和分布表征进行学习,以提高搜索效果。文章首先介绍了作者的背景信息,然后详细解释了局部和分布表征下的搜索模型的核心思想。该模型结合了学习完全匹配的局部表征和模糊匹配的分布表征,通过两部分学习出的向量的加和来形成最终的表征。实验结果显示,该模型在性能上取得了不错的成绩,NDCG在第10位的表现接近0.53,明显优于传统方法。最后,文章提出了一个思考题,邀请读者讨论深度学习在搜索领域取得的成果。整体而言,该文章为读者提供了一种新的搜索建模方法,并展示了其在实验中的有效性,为深度学习在搜索领域的应用提供了有益的参考。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论