067 | 推荐的Exploit和Explore算法之一:EE算法综述
洪亮劼
该思维导图由 AI 生成,仅供参考
上周,我们聊了一些比较高级的模型,包括张量分解和协同矩阵分解,讨论这些模型如何能够抓住更多的用户和物品之间的关系。最后,我们还讨论了如何优化更加复杂的目标函数。
这周,我们来看一个完全不同的话题,那就是 Exploitation(利用)和 Exploration(探索)的策略,俗称“EE 策略”。
一个推荐系统,如果片面优化用户的喜好,很可能导致千篇一律的推荐结果。其实,EE 策略是推荐系统里很有意思,但也非常有争议的一个话题。一方面,大家都明白这类算法的目的,每年有很多相关论文发表。但另一方面,工业界对于部署这类算法非常谨慎,有的产品经理甚至视之为“洪水猛兽”。我们今天就来分析一下导致这个现象的一些因素。
走一步看一步的策略
这里再简单阐述一下什么是 EE。简单来说,就是我们在优化某些目标函数的时候,从一个时间维度来看,当信息不足或者决策不确定性(Uncertainty)很大的时候,我们需要平衡两类决策:
选择现在可能是最佳的方案;
选择现在不确定,但未来可能会有高收益的方案。
在做这两类决策的过程中,我们也逐渐更新对所有决策不确定性的认识。最终,从时间的维度上来看,我们在不确定性的干扰下,依然能够去优化目标函数。
也就是说,EE 可以看作是一个优化过程,需要多次迭代才能找到比较好的方案。
EE 的应用历史
早期把 EE 应用于新闻推荐系统的文章,主要关注在雅虎的今日新闻(Today Module)这一产品上,这也基本上是 EE 最早在互联网应用的尝试,目的是为了优化点击率(CTR)。而更早的一些奠基性的文章,则是在广告的数据集上展示实验结果。
雅虎的今日新闻其实为 EE 提供了一些被很多学者和工业界人士忽视了的条件和成功因素。如果不考虑这些因素,鲁莽地在其他场景中使用这些文献中相似的算法,很可能会产生相当差的效果。那么是哪些因素呢?主要有两点。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
推荐系统中的EE算法是一种利用和探索策略,旨在平衡当前最佳选择和未来高收益可能性的决策。该算法需要多次迭代才能找到较好的方案。早期在雅虎今日新闻等产品上的应用展示了成功因素,如相对少量的优质资源和大量用户量。然而,EE的产品部署面临诸多难点,如上线测试和平衡产品体验。为了解决这些问题,可以考虑采用“反向EE”和夹带“私货”的思路,以提升用户友好性。总的来说,EE算法在推荐系统中具有重要意义,但在产品部署和用户体验方面仍需进一步探讨和改进。 这篇文章深入探讨了推荐系统中的EE算法,介绍了其历史和应用,以及在产品部署中所面临的挑战。文章提出了解决问题的思路,并留下了一个引人思考的问题,引发读者思考和讨论。通过本文,读者可以快速了解EE算法的重要性和挑战,以及在产品部署中的一些解决思路。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(2)
- 最新
- 精选
- 吴文敏工业界用EE主要是一部分是为了解决冷启动问题,反向EE有助于解决新物品的冷启动问题。对于新用户可以从topN的物品中使用R算法探索用户兴趣2018-04-033
- 林彦EE策略需要用户花足够时间探索,同时保证总有新的高质量/高匹配度的内容的产生。此外如果对受欢迎的内容没有什么惩罚(有些产品形态会导致受欢迎的内容倍增地受用户关注),对内容的新旧没有什么系数调整,则用户看到不同的东西的几率更小。 也和用户本身的做事风格有关,有的用户更倾向于看自己熟悉的东西,有的则愿意经常尝试不同的新东西。不知道现有的EE工业化产品会不会考虑到这种用户行为方式的区别。2018-03-191
收起评论