017 | The Web 2018论文精读:如何改进经典的推荐算法BPR?
洪亮劼
该思维导图由 AI 生成,仅供参考
今天,我们来看万维网大会上的一篇优秀短论文。在万维网大会上,主要发表两类论文。一类是 10 页的长论文,一类是 2 页的短论文或称作展板论文。短论文主要是发表短小的成果或者是还在研究过程中的重要成果。每一届的万维网大会,都会评选出一篇最佳短论文奖。
今天我和你分享的论文,题目是《利用查看数据,贝叶斯个性化排序的一种改进的取样器》(An Improved Sampler for Bayesian Personalized Ranking by Leveraging View Data)。这篇论文也有六位作者,和我们介绍的上一篇论文一样,都来自清华大学和新加坡国立大学。
贝叶斯个性化排序
要想理解这篇论文的内容,我们必须要讲一下什么是“贝叶斯个性化排序”(Bayesian Personalized Ranking),或者简称是 BPR。有关 BPR 的详细介绍,可以阅读参考文献[1]。我们在这里仅对 BPR 进行一个高维度的总结。
简单来说,BPR 是推荐系统中的一个配对排序(Pairwise)学习算法。在我们前面介绍搜索算法的时候,曾经提到了各种配对排序学习算法。配对排序学习不是针对每一个数据实例来学习其标签或者响应变量,而是学习一个相对的顺序,希望能够把所有的正例都排列到负例之前。也就是说,对于配对排序来说,每一个数据实例的预测值本身并不重要,排序算法在意的是对于一正一负的一个配对来说,是否能够把正例给准确地排列到负例之上。这其实就要求 BPR 在数值上对正例的预测值能够比负例的预测值高。
BPR 主要是解决了在推荐系统中长期以来只对单个数据点进行预测,比如需要对用户物品的喜好矩阵建模的时候,之前的大多数算法都无法有效地对没有观测到的数据进行建模。而 BPR 是配对算法,因此我们只需要关注观测的数据以及他们之间的关系,从而能够对用户的喜好,特别是有“隐反馈”(Implicit Feedback)数据的时候,取得更加明显的效果。这里的隐反馈指的并不是用户告诉系统其对每一个物品的喜好程度,而是用户在和系统的交互过程中通过一些行为表达出的喜好。这些用户的行为往往并不全面,因此需要算法和模型能够对这些行为进行有效建模。
论文的主要贡献和核心方法
了解了 BPR 大概是怎么回事以后,我们来看一看这篇论文的主要贡献和核心方法。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
这篇文章介绍了如何改进经典的推荐算法BPR(Bayesian Personalized Ranking)。BPR是一个配对排序学习算法,用于解决推荐系统中的隐反馈数据建模问题。文章提出了一种改进的取样器,通过对用户的行为数据进行划分和采样,提高了算法的有效度和效率。 在论文中,作者首先介绍了BPR算法的基本原理和应用背景,然后提出了两个主要贡献:一是发现全局均匀地采样负样本可能会影响最后学习效果,二是提出了一种负样本采样的方法,利用更多的用户“浏览”信息来提升算法的整体训练效果。作者还通过实验验证了他们的方法,在母婴产品网站和天猫的数据集上取得了显著的效果提升。 这篇论文的亮点在于提出了一种新的负样本采样方法,通过对用户行为数据的划分和采样,使得算法的推荐效果比传统方法提高了60%左右。这对于提高推荐系统的准确度和用户体验具有重要意义。 总的来说,这篇论文对BPR算法进行了深入的研究和改进,提出了一种创新的负样本采样方法,为推荐系统的优化提供了有益的思路和实践经验。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 吴文敏对这个思路稍作拓展,我们只要定义隐反馈行为间的偏序关系,就可以基于多种隐反馈(浏览、点击、购买、加入购物车)进行配对采样2018-07-202
收起评论