• slvher
    2018-10-02
    加权采样算法 Weighted Random Sampling Without Replacement,可简写为WRS

    本文给出的算法出自 Pavlos S. Efraimidis 论文:
    https://utopia.duth.gr/~pefraimi/research/data/2007EncOfAlg.pdf

    也可通过蓄水池采样算法的wikipedia条目了解:
    https://en.wikipedia.org/wiki/Reservoir_sampling
    展开
    
     3
  • felixdae
    2018-07-11
    第一个例子中k其实是1对吧,如果k是2或者3模拟出来的结果还会保持与权重一样的比例关系吗?
    
     1
  • 林彦
    2018-04-25
    负权重的例子我其实还是不太理解的。原始的WRS算法就是要求权重是非负数。我能想到的是按权重的绝对值算采样分数,然后负的得出一个最差排名,正的得出一个最好排名。
    
     1
  • 行行行
    2018-04-23
    s=r^1/w的原理是什么呢老师,或者有什么参考资料,或者这个算法叫什么名字。谢谢老师
    
     1
  • 光彩照人
    2019-07-23
    指数分布这个,是不是应该取出随机数最小的k个进行采样呢,因为越小,说明时间间隔越短,说明权重越大呢。
    
    
  • miaomiaomiao
    2019-06-12
    请问,在推荐算法召回阶段,蓄水池采样权重是什么?是本身推荐物品与该用户的匹配概率吗?
    模型融合阶段的权重又是什么?这个时候各个召回模块的推荐的物品的评价标准并不一致
    
    
  • shangqiu86
    2019-05-06
    指数分布采样的时候,随机数选取应该在(1 - 5)之间,当大于5之后,lambd = 0.1得到的值将远远大于lambd = 0.4和0.5 ,这样若随机数选取在(1-10)之间得到的数据并不满足权重的关系,我的实验结果是这样的,老师您说对吗?
    
    
  • felixdae
    2018-06-04
    把权重除以权重之和得到标签上的离散分布,不是就可以直接用来采样了么,采样频率也跟权重成正比
    
    
  • cjalchange
    2018-05-24
    无刀老师,请问指数分布采样公式中的x是取的啥值呀
    
    
我们在线,来聊聊吧