069 | 推荐的Exploit和Explore算法之三:汤普森采样算法
洪亮劼
该思维导图由 AI 生成,仅供参考
周三的分享里,我们讨论了一种叫作 UCB(Upper Confidence Bound)的算法。这种算法的核心是使用均值和标准差组成对物品的估计,并且利用这种估计达到 EE 的效果。同时,我们也提到,UCB 的最大问题就是并没有真正达到随机的效果。
今天,我们来看一种不太一样的算法,叫“汤普森采样”(Thompson Sampling)。
为什么需要随机采样?
在讨论汤普森采样之前,我们先来看一看什么是随机采样。随机采样的技术和概率分布密不可分,也和计算机产生随机数有很大的联系。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
汤普森采样算法是一种解决UCB算法“确定性”问题的重要算法。文章首先介绍了为什么需要引入随机采样机制,随后详细解释了汤普森采样的基本原理。该算法通过从模型的后验分布中进行抽样,实现了真正的随机效果。汤普森采样的优势在于其随机性,能够尊重点击率的数值大小,解决了UCB算法的问题。此外,由于使用了贝叶斯统计,对于当前点击率估计不准确甚至没有数据的物品也具有天然优势。总之,汤普森采样算法在解决UCB算法问题的同时,实现了真正的随机效果,为推荐系统的优化提供了重要思路。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(2)
- 最新
- 精选
- 兔子ORZ后验分布很复杂的时候,Thompson采样收敛速度会很慢。可以尝试更高级的采样方式 Importance Sampling或者MCMC,Gibbs呢2018-04-111
- 林彦当被采样的物品点击率很接近时,这些物品会一直被计算和采样。可能会比较耗时2018-03-23
收起评论