060 | 简单推荐模型之三：基于内容信息的推荐模型

洪亮劼



该思维导图由 AI 生成，仅供参考

周一的文章中，我们聊了一个最基本的基于流行度的推荐模型。周三我们讨论了基于相似信息的推荐模型。基于相似信息的推荐模型，其核心就是协同过滤的思想，希望能够通过相似的用户或者相似的物品来对当前的场景进行推荐。
然而，不管是基于流行度的推荐，还是协同过滤，这些方法都有一些根本的问题。比如，对于基于流行度预测的推荐来说，推荐结果不是个性化的。因为流行度预测是一种全局的预测，每个人得到的推荐结果是一样的。而协同过滤的问题是强烈依赖相似用户以及相似物品的定义，而且对于新用户或者新物品来说有数据稀缺的问题。因此，在实际应用中，往往不能在整个系统中单独使用协同过滤。
今天，我们来分享一个更加普遍的方法，那就是基于内容信息的推荐系统。这种系统在实践中往往更能适应各种不同的推荐场景。
什么是基于内容信息的推荐系统所谓基于内容信息的推荐系统，其实就是用特征（Feature）来表示用户、物品以及用户和物品的交互，从而能够把推荐问题转换成为监督学习任务。
把推荐系统完全定义为监督学习任务，需要有这么几个步骤。
第一，就是我们已经提到的，需要把所有用户、物品的各种信号用特征来表示。这里面往往牵涉非常复杂和繁琐的特征工程，也就是看如何能够把不同的信息通过特征表达出来。
第二，就是每一个监督任务都需要面临的问题，如何构造一个目标函数，来描述当前的场景。可以说，这是最难的一个部分，也是和基于流行度和基于相似度的推荐系统的最大区别。
内容信息的各类特性那么，对于物品特性来说，有哪些是比较重要的呢？这里我们肯定没法提供一个完备的列表，那我就来谈一些主要的特性，起到一个抛砖引玉的作用。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

基于内容信息的推荐系统是一种更加普遍的推荐方法，它通过使用特征来表示用户、物品和用户与物品的交互，将推荐问题转换为监督学习任务。文章介绍了构建基于内容的推荐系统的步骤和重要性，以及物品和用户特征的各类特性。对于物品特性来说，重要的特性包括文本信息、类别信息和图像或其他多媒体信息，而用户特性则包括基本特性和用户画像。此外，文章还讨论了监督学习任务的目标函数，如点击率、购买率等。总的来说，基于内容信息的推荐系统将所有信号视为特征，并构建一个监督学习任务，以此来进行推荐。文章最后提出了一个思考题，即如何将基于流行度和协同过滤的推荐系统融入基于内容的推荐系统中。这篇文章通过简洁明了的语言，深入浅出地介绍了基于内容信息的推荐系统的基本概念和关键要点，为读者提供了对该推荐模型的快速了解和理解。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(2)

最新
精选

微微一笑
能不能再深入一点,增加些工程方面的内容
2018-03-02

9
林彦
1. 基于流行度的算法对于新用户的冷启动问题来说是一个优秀的解决方案。这些算法通过某些流行度的测量标准，比如下载最多的或者购买最多的，来对物品进行排名，并将这些流行度最高的物品推荐给新用户。当拥有合适的流行度衡量指标时，这个办法虽然基础却很有效，通常可以为其他算法提供很好的基线标准。流行度算法也可以单独作为算法使用，以引导推荐系统在换到其他更切合用户兴趣点的算法（比如协同过滤算法以及基于内容过滤的算法）前获得足够的活跃度与使用量。流行度模型也可以引入混合算法中，从而解决新用户的冷启动问题。 2. 基于内容和协同过滤的混合算法结合了用户及物品的内容特性以及使用数据，以利用这两类数据的优点。协同过滤算法存在冷启动和稀疏性的问题。因为是基于内容（特性）预测的，这一点并不会对基于内容的算法产生限制。首先用基于内容的推荐得到项目的特性，找出新项目的相似项目，然后通过用户对相似项目的评价来预测对新项目的评分，再用传统的协同过滤推荐在相似项目的范围内计算邻居用户并给出最终的预测评分，使新项目参与到推荐中。
2018-03-05

6

收起评论