AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

047 | 多轮打分系统概述

可能需要其他轮数的原因
第一轮一般都是针对单一文档的打分,而只有第二轮才能利用上配对法或者列表法针对文档打分
文档已经从索引中到达了内存
WAND操作符和线性模型是提取文档的一些技术特点
倒排索引是一个非常重要的机制
快速从非常巨大的数据集中返回有价值的几百到几千的文档
第二轮或以后轮数的重排
第一轮打分(顶部K提取)
机器学习模型的高计算时间复杂度
针对每一个查询关键字,需要对数据集中的每一个文档进行打分
Runtime Optimizations for Tree-Based Machine Learning Models
Efficient query evaluation using a two-level retrieval process
Two-Stage learning to rank for information retrieval
Efficient Cost-Aware Cascade Ranking in Multi-Stage Retrieval
Ranking Relevance in Yahoo Search
两轮打分框架
为什么搜索系统需要多轮打分?
需要在整个数据集上快速评价出几百到几千不等的文档,然后在这个集合上运用复杂的模型进行计算并排序
需要对数据集中的每一个文档进行打分
机器学习搜索系统的目的是利用机器学习模型预测文档和搜索关键字之间的相关性
参考文献
多轮打分系统综述
多轮打分系统的核心思路是什么?

该思维导图由 AI 生成,仅供参考

周一我为你介绍了搜索系统的一个宏观分类,包括传统的文本匹配信息检索系统和机器学习信息检索系统。这个分类可以让你非常清晰地了解信息搜索系统的历史进程,并对这两种搜索系统的特点有所了解。
今天我们就来剖析搜索系统的另一个框架体系:多轮打分(Scoring)系统

多轮打分系统综述

什么是多轮打分系统?为什么搜索系统需要多轮打分?
我们拿上次介绍的机器学习搜索系统为例。从整体来说,机器学习搜索系统的目的是利用机器学习模型来预测文档和搜索关键字之间的相关性。那么,在理想状态下,针对每一个查询关键字,我们需要对数据集中的每一个文档进行打分。
如果是一个类似互联网搜索引擎的应用场景,那么理论上,每一个查询关键字都需要对几亿甚至十几亿的网页进行打分。显然,仅仅从这个数量级上来说,这样做都是不现实的。
从另一个方面来讲,目前比较通用的机器学习模型,特别是在排序问题上有强劲表现的树模型(Tree Model),比如 GBDT(Gradient Boosted Decision Trees)或者神经网络,都有较高的计算时间复杂度。要想在实时响应的反应时间内(例如几百毫秒内)对相对比较多(我们这里说的是几千甚至上万)的文档进行打分是很困难的,我们刚才提到的整个数据集中是有几亿甚至十几亿的文档,那就更加困难了。
于是在这样的情况下,我们就需要有这么一种机制:对于每个查询关键字而言,能够先有一个方法在整个数据集上快速评价出几百到几千不等(视具体应用)的文档,然后在这个几百到几千不等的集合上运用复杂的模型进行计算并且排序。 这种需要对文档进行两轮打分的流程叫做“两轮打分框架”(见参考文献[3])。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

多轮打分系统是现代搜索技术中的重要思路,旨在解决大规模数据集下的文档相关性评分问题。该系统通过“顶部K提取”迅速筛选出较少的文档,然后在这个文档集合上应用复杂模型进行第二轮打分,以提高搜索结果的质量。其核心特点是每一轮都筛选出更少的文档,并且每一轮使用的特性数目和模型都比上一轮更加复杂。第一轮中广泛应用倒排索引和简单模型,而在后续轮数中则使用更复杂的模型。此外,多轮打分系统还可以引入商业规则和生成更精细的特性来进一步提高排序的精度。这种系统的设计旨在平衡计算效率和搜索结果质量,是搜索系统中的重要技术创新。 参考文献包括多篇相关研究,其中提到了Yahoo Search的相关性排名、多阶段检索中的高效成本感知级联排名等内容。这些研究为多轮打分系统的设计和优化提供了有益的参考。总的来说,多轮打分系统在搜索技术中具有重要意义,为提高搜索结果的质量和效率提供了有力支持。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(4)

  • 最新
  • 精选
  • 极客星星
    由于第一轮的主要功能是召回 所以我觉得应该以召回率为主要评估指标 不知道理解是否正确

    作者回复: 是的。但是要衡量召回率需要知道所有可能相关的文档,这几乎是不可能的。具体有什么好办法呢?

    2017-12-20
    4
  • ID
    WAND 操作符并不是把一个通用的、普遍的线性模型应用到文档索引上,而是说,如果我们能够把模型给简化为只有正系数的线性模型,那么,整个模型其实可以看做是两个向量的点积,而 WAND 则是对点积在索引上的一种优化。(这句话没懂) 模型是什么样的?特征是什么?预测的标签又是什么?怎么使用模型结果?怎么优化这个模型?
    2019-11-12
  • jifei
    目前我们的搜索也是做了两轮打分,第一轮搜索引擎排序:结合了文本得分以及物品质量、商业目标定义的得分值;第二轮机器学习算法排序:基于用户的反馈数据,离线训练模型,线上实时预测。下一步打算第一轮扩大召回范围以及个性化召回,让第二轮的数据量提上来在第二轮打分上内部实现分页。老师觉得怎么样呢?
    2018-12-08
  • 白杨
    从经验上来判断bm25是否在一个范围内,而这个经验的范围可以通过机器学习的方式来拟合出来,这样可行吗?
    2018-05-17
收起评论
显示
设置
留言
4
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部