AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

069 | 推荐的Exploit和Explore算法之三:汤普森采样算法

解决了UCB的问题
针对当前点击率估计不准确的物品有天然的优势
采样的结果尊重点击率的数值大小
使用了贝叶斯统计
从后验概率分布中进行抽样
参数采样的动作
介绍了为什么需要引入采样的机制和汤普森采样的基本原理
汤普森采样可以解决UCB的“确定性”问题,实现随机的效果
优势
汤普森采样的流程
从后验概率分布中抽样
构建场景的概率分布
从模型的后验分布中采样
确定性算法导致丧失“探索”机会
P%的人群看到按照点击率排序的物品,缺点是部分过于确定,部分过于随机
样本可以用来刻画一个概率分布
从概率分布中产生随机变量的样本
抽样的重要性
最大问题是并没有真正达到随机的效果
核心是使用均值和标准差组成对物品的估计
小结
汤普森采样基本原理
UCB算法的问题
EG算法
随机采样
UCB算法
推荐的Exploit和Explore算法之三:汤普森采样算法

该思维导图由 AI 生成,仅供参考

周三的分享里,我们讨论了一种叫作 UCB(Upper Confidence Bound)的算法。这种算法的核心是使用均值和标准差组成对物品的估计,并且利用这种估计达到 EE 的效果。同时,我们也提到,UCB 的最大问题就是并没有真正达到随机的效果。
今天,我们来看一种不太一样的算法,叫“汤普森采样”(Thompson Sampling)。

为什么需要随机采样?

在讨论汤普森采样之前,我们先来看一看什么是随机采样。随机采样的技术和概率分布密不可分,也和计算机产生随机数有很大的联系。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

汤普森采样算法是一种解决UCB算法“确定性”问题的重要算法。文章首先介绍了为什么需要引入随机采样机制,随后详细解释了汤普森采样的基本原理。该算法通过从模型的后验分布中进行抽样,实现了真正的随机效果。汤普森采样的优势在于其随机性,能够尊重点击率的数值大小,解决了UCB算法的问题。此外,由于使用了贝叶斯统计,对于当前点击率估计不准确甚至没有数据的物品也具有天然优势。总之,汤普森采样算法在解决UCB算法问题的同时,实现了真正的随机效果,为推荐系统的优化提供了重要思路。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(2)

  • 最新
  • 精选
  • 兔子ORZ
    后验分布很复杂的时候,Thompson采样收敛速度会很慢。可以尝试更高级的采样方式 Importance Sampling或者MCMC,Gibbs呢
    2018-04-11
    1
  • 林彦
    当被采样的物品点击率很接近时,这些物品会一直被计算和采样。可能会比较耗时
    2018-03-23
收起评论
显示
设置
留言
2
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部