AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

067 | 推荐的Exploit和Explore算法之一:EE算法综述

EE策略是否一定会导致用户看到多样不同的东西
用户友好型的EE思路
如何平衡产品
上线测试难点
今日新闻提供了成功因素和被忽视的条件
早期应用于新闻推荐系统,主要关注雅虎的今日新闻
EE是一个优化过程,需要多次迭代才能找到好的方案
EE策略的目的和争议
小结
EE的产品部署难点
EE的应用历史
本周讨论Exploitation和Exploration策略
上周讨论了高级模型,包括张量分解和协同矩阵分解
推荐系统的Exploit和Explore算法综述

该思维导图由 AI 生成,仅供参考

上周,我们聊了一些比较高级的模型,包括张量分解和协同矩阵分解,讨论这些模型如何能够抓住更多的用户和物品之间的关系。最后,我们还讨论了如何优化更加复杂的目标函数。
这周,我们来看一个完全不同的话题,那就是 Exploitation(利用)和 Exploration(探索)的策略,俗称“EE 策略”。
一个推荐系统,如果片面优化用户的喜好,很可能导致千篇一律的推荐结果。其实,EE 策略是推荐系统里很有意思,但也非常有争议的一个话题。一方面,大家都明白这类算法的目的,每年有很多相关论文发表。但另一方面,工业界对于部署这类算法非常谨慎,有的产品经理甚至视之为“洪水猛兽”。我们今天就来分析一下导致这个现象的一些因素。

走一步看一步的策略

这里再简单阐述一下什么是 EE。简单来说,就是我们在优化某些目标函数的时候,从一个时间维度来看,当信息不足或者决策不确定性(Uncertainty)很大的时候,我们需要平衡两类决策:
选择现在可能是最佳的方案;
选择现在不确定,但未来可能会有高收益的方案。
在做这两类决策的过程中,我们也逐渐更新对所有决策不确定性的认识。最终,从时间的维度上来看,我们在不确定性的干扰下,依然能够去优化目标函数。
也就是说,EE 可以看作是一个优化过程,需要多次迭代才能找到比较好的方案

EE 的应用历史

早期把 EE 应用于新闻推荐系统的文章,主要关注在雅虎的今日新闻(Today Module)这一产品上,这也基本上是 EE 最早在互联网应用的尝试,目的是为了优化点击率(CTR)。而更早的一些奠基性的文章,则是在广告的数据集上展示实验结果。
雅虎的今日新闻其实为 EE 提供了一些被很多学者和工业界人士忽视了的条件和成功因素。如果不考虑这些因素,鲁莽地在其他场景中使用这些文献中相似的算法,很可能会产生相当差的效果。那么是哪些因素呢?主要有两点。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

推荐系统中的EE算法是一种利用和探索策略,旨在平衡当前最佳选择和未来高收益可能性的决策。该算法需要多次迭代才能找到较好的方案。早期在雅虎今日新闻等产品上的应用展示了成功因素,如相对少量的优质资源和大量用户量。然而,EE的产品部署面临诸多难点,如上线测试和平衡产品体验。为了解决这些问题,可以考虑采用“反向EE”和夹带“私货”的思路,以提升用户友好性。总的来说,EE算法在推荐系统中具有重要意义,但在产品部署和用户体验方面仍需进一步探讨和改进。 这篇文章深入探讨了推荐系统中的EE算法,介绍了其历史和应用,以及在产品部署中所面临的挑战。文章提出了解决问题的思路,并留下了一个引人思考的问题,引发读者思考和讨论。通过本文,读者可以快速了解EE算法的重要性和挑战,以及在产品部署中的一些解决思路。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(2)

  • 最新
  • 精选
  • 吴文敏
    工业界用EE主要是一部分是为了解决冷启动问题,反向EE有助于解决新物品的冷启动问题。对于新用户可以从topN的物品中使用R算法探索用户兴趣
    2018-04-03
    3
  • 林彦
    EE策略需要用户花足够时间探索,同时保证总有新的高质量/高匹配度的内容的产生。此外如果对受欢迎的内容没有什么惩罚(有些产品形态会导致受欢迎的内容倍增地受用户关注),对内容的新旧没有什么系数调整,则用户看到不同的东西的几率更小。 也和用户本身的做事风格有关,有的用户更倾向于看自己熟悉的东西,有的则愿意经常尝试不同的新东西。不知道现有的EE工业化产品会不会考虑到这种用户行为方式的区别。
    2018-03-19
    1
收起评论
显示
设置
留言
2
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部