017 | The Web 2018论文精读:如何改进经典的推荐算法BPR?
洪亮劼

今天,我们来看万维网大会上的一篇优秀短论文。在万维网大会上,主要发表两类论文。一类是 10 页的长论文,一类是 2 页的短论文或称作展板论文。短论文主要是发表短小的成果或者是还在研究过程中的重要成果。每一届的万维网大会,都会评选出一篇最佳短论文奖。
今天我和你分享的论文,题目是《利用查看数据,贝叶斯个性化排序的一种改进的取样器》(An Improved Sampler for Bayesian Personalized Ranking by Leveraging View Data)。这篇论文也有六位作者,和我们介绍的上一篇论文一样,都来自清华大学和新加坡国立大学。
贝叶斯个性化排序
要想理解这篇论文的内容,我们必须要讲一下什么是“贝叶斯个性化排序”(Bayesian Personalized Ranking),或者简称是 BPR。有关 BPR 的详细介绍,可以阅读参考文献[1]。我们在这里仅对 BPR 进行一个高维度的总结。
简单来说,BPR 是推荐系统中的一个配对排序(Pairwise)学习算法。在我们前面介绍搜索算法的时候,曾经提到了各种配对排序学习算法。配对排序学习不是针对每一个数据实例来学习其标签或者响应变量,而是学习一个相对的顺序,希望能够把所有的正例都排列到负例之前。也就是说,对于配对排序来说,每一个数据实例的预测值本身并不重要,排序算法在意的是对于一正一负的一个配对来说,是否能够把正例给准确地排列到负例之上。这其实就要求 BPR 在数值上对正例的预测值能够比负例的预测值高。
BPR 主要是解决了在推荐系统中长期以来只对单个数据点进行预测,比如需要对用户物品的喜好矩阵建模的时候,之前的大多数算法都无法有效地对没有观测到的数据进行建模。而 BPR 是配对算法,因此我们只需要关注观测的数据以及他们之间的关系,从而能够对用户的喜好,特别是有“隐反馈”(Implicit Feedback)数据的时候,取得更加明显的效果。这里的隐反馈指的并不是用户告诉系统其对每一个物品的喜好程度,而是用户在和系统的交互过程中通过一些行为表达出的喜好。这些用户的行为往往并不全面,因此需要算法和模型能够对这些行为进行有效建模。
论文的主要贡献和核心方法
了解了 BPR 大概是怎么回事以后,我们来看一看这篇论文的主要贡献和核心方法。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 吴文敏对这个思路稍作拓展,我们只要定义隐反馈行为间的偏序关系,就可以基于多种隐反馈(浏览、点击、购买、加入购物车)进行配对采样2
收起评论