069 | 推荐的Exploit和Explore算法之三:汤普森采样算法
洪亮劼

周三的分享里,我们讨论了一种叫作 UCB(Upper Confidence Bound)的算法。这种算法的核心是使用均值和标准差组成对物品的估计,并且利用这种估计达到 EE 的效果。同时,我们也提到,UCB 的最大问题就是并没有真正达到随机的效果。
今天,我们来看一种不太一样的算法,叫“汤普森采样”(Thompson Sampling)。
为什么需要随机采样?
在讨论汤普森采样之前,我们先来看一看什么是随机采样。随机采样的技术和概率分布密不可分,也和计算机产生随机数有很大的联系。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(2)
- 最新
- 精选
- 兔子ORZ后验分布很复杂的时候,Thompson采样收敛速度会很慢。可以尝试更高级的采样方式 Importance Sampling或者MCMC,Gibbs呢1
- 林彦当被采样的物品点击率很接近时,这些物品会一直被计算和采样。可能会比较耗时
收起评论