AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

052 | 机器学习排序算法经典模型:RankSVM

算法直到所有约束条件的误差小于一个全局的参数误差为止
保持一个工作集合来存放当前循环时依然被违反的约束条件,集中优化这部分工作集合的约束条件
Thorsten Joachims在2006年提出的算法,使用CP算法(Cutting-Plane)降低计算复杂度
难点在于如何降低计算复杂度
计算复杂度是N的平方级,不适用于大规模数据
针对数据配对的差值进行建模,成为配对法排序学习的经典模型
在线性假设下,学习一组线性系数W,使得X2点积W的结果大于X1点积W的结果
改变问题设置,学习模型准确预测Y的顺序
Thorsten Joachims及合作者发表一系列论文,详细论述排序支持向量机在搜索中的应用
Ralf Herbrich提出将支持向量机和有序回归结合
20世纪90年代中后期,支持向量机逐渐成为机器学习主流模型
是否可以将更加简单的对数几率分类器应用到排序问题上
广泛应用于排序问题
解决方案
难点
模型
历史
思考
应用
RankSVM
机器学习排序算法经典模型

该思维导图由 AI 生成,仅供参考

到目前为止,我们在专栏里已经讨论了关于搜索引擎方方面面的很多话题,包括经典的信息检索技术、查询关键字理解、文档理解以及现代搜索引擎的架构等等 。同时,我们也从机器学习角度出发对搜索引擎的最核心部分,也就是排序算法进行了最基本的分享,囊括了单点法排序学习(Pointwise Learning to Rank)、配对法排序学习(Pairwise Learning to Rank)以及列表法排序学习(Listwise Learning to Rank),相信你应该对这类算法的大概内容有所掌握。
那么,这周我们就来看看机器学习排序算法中几个经典的模型,希望能够通过这几个经典的算法为你深入学习和研究排序算法指明方向。
今天,我就来分享配对法排序中最有价值一个算法,排序支持向量机(RankSVM)。这个算法的核心思想是应用支持向量机到序列数据中,试图对数据间的顺序直接进行建模

排序支持向量机的历史

20 世纪 90 年代中后期,受统计学习理论(Statistical Learning Theory )思想和风险最小化框架(Risk Minimization Framework)趋于成熟的影响,支持向量机逐渐成为当时机器学习界的主流模型。一时间,各个应用领域的学者和工程师都在思考如何把支持向量机利用到自己的问题领域上,从而获得更好的效果。
拉夫⋅赫博里奇(Ralf Herbrich)发表于 1999 年[1]和 2000 年[2]的论文中讨论了如何把支持向量机和有序回归(Ordinal Regression)结合起来。赫博里奇当时在柏林科技大学(Technical University of Berlin)攻读博士学位。2000 年到 2011 年,他在微软研究院和 Bing 任职,从事机器学习,特别是贝叶斯方法(Bayesian method)的研究。2011 年到 2012 年,他在 Facebook 短暂任职后,于 2012 年加入了亚马逊负责机器学习的研发工作,并且担任在柏林的研发中心主管经理(Managing Director)。尽管赫博里奇很早提出了把有序回归和支持向量机结合的思路,但是当时的论文并没有真正地把这个新模型用于大规模搜索系统的验证。
更加完整地对排序支持向量机在搜索中的应用进行论述来自于康奈尔大学教授索斯腾⋅乔基姆斯(Thorsten Joachims)以及他和合作者们发表的一系列论文(见参考文献[3]、[4]、[5]和[6])。索斯滕我们前面介绍过,他是机器学习界享有盛誉的学者,是 ACM 和 AAAI 的双料院士;他所有论文的引用数超过 4 万次;他获得过一系列奖项,包括我们前面讲的 2017 年 ACM KDD 的时间检验奖等等。

排序支持向量机模型

在说明排序支持向量机之前,我们先来简要地回顾一下支持向量机的基本思想。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

RankSVM是一种经典的机器学习排序算法,将支持向量机应用于序列数据的算法。该算法直接对数据间的顺序进行建模,成为主流模型受统计学习理论和风险最小化框架的影响。RankSVM的历史可以追溯到Ralf Herbrich和Thorsten Joachims的研究成果。在排序支持向量机模型中,需要学习一个模型能够准确地预测出标签的顺序。然而,该模型的难点在于其计算复杂度为N的平方级,使得在大规模数据上的应用变得困难。为解决这一难题,Thorsten Joachims提出了一种算法,即CP算法,能够将排序支持向量机的算法转换成更加计算有效的优化过程,在线性计算复杂度的情况下完成。因此,RankSVM在大规模数据上的应用变得更加可行。文章还提到了排序支持向量机的历史背景、问题设置、难点和一个实用的算法。这篇文章为读者介绍了RankSVM的基本原理和应用,为了更好地理解这一内容,读者还可以参考相关的论文。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • tt
    对数几率分类器更好应用,因为它直接给出了一个实数结果可以作为分数
    2019-07-29
收起评论
显示
设置
留言
1
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部