极客时间-轻松学习，高效学习-极客邦

瑞雪

2018-03-28

你好，请问如果选取一部分为负样本，其他的缺失值在矩阵分解时是直接使用NaN吗，有点对正负样本分不太清:D

 3

 6
林彦

2018-03-28

1. 既然可以根据物品的热门程度选择负样本，是不是类似也可以根据用户的活跃程度选择负样本?
2. 是不是可以借鉴之前基于内容推荐的方法，先找出和当前用户或场景类似内容的用户或场景中的热门物品的交互作为负样本？这里用户或场景可以用各种距离度量的方式选出k个最相邻的。基于内容相似度找和正样本最相邻的物品作为负样本可能也可以。
3. 负样本从概率分布中采样，概率分布的参数让整体的期望值和真实值尽可能接近。这样交互次数多的有更大概率被选中，或者可以看成赋予了更大权重。
4. 引入一个概率参数变量，有交互的概率为p(i, j)，预测交互值为1；无交互的概率为p(i, j)，预测交互值为0。除了计算用户和物品隐变量外，把用户和物品隐变量固定后再估算这个概率参数。



 5
王掌柜家的小二

2018-12-09

有个问题没想明白的，上网找了下也没明白的：在交替最小二乘法的原理中，既然已经是随机初始化了矩阵P，求得Q就是一个确定的结果了，那么这时候用Q反过来求P的意义何在呢？得到不也是同一个P吗？既然两个值是确定的，又何来迭代一说？
知道自己理解的肯定有问题，忘老师回复。

作者回复: 交替最小二乘，“最小二乘”就不是确定解，而是数值优化解，所以不存在你说的这种情况。

 1

 2
Drxan

2018-03-28

大神，如果要对负样本进行采样的话，是不是就无法用矩阵分解了



 2
shangqiu86

2019-04-29

负样本采样最最精准的应该是曝光而无行为的那些用户sku对，即对该用户来说该sku曝光了，但是用户对该sku没有行为，但是这个量会很大，可以从中抽样得到负样本



 1
cl

2019-01-19

还是没有明白，矩阵分解前提是需要分数矩阵，针对没有评分体系的应用从隐式反馈数据中构建这个分数矩阵，就是上一章遗留的问题，能否结合实例说一下？？

 1

 1
yalei

2018-04-10

通常用户需要一个“入口”才能浏览商品详情，这个入口可大部分情况下是搜索结果和算法推荐。可以设置曝光埋点，再结合点击埋点来找到真正的负样本（有曝光而无点击的样本）



 1
森林

2018-04-02

目标函数里置信度C是1+aC，如果我们挑负样本的话，负样本的次数是啥？



 1
曾阿牛

2018-03-28

在构建点击率预估模型时，仅将正样本附近未点击的样本视为负样本。样本量大时，剔除一段时间内没有转化行为的用户数据（包括正负样本）



 1
neohope

2019-12-04

负样本构建方法：
1、通过页面或APP曝光，用户没有反应的
2、告知用户有优惠活动或优惠券，用户无动于衷的
3、根据用户画像，以及物品标签，用户不需要的物品
4、用户明确标记不感兴趣的物品或不认识的人
5、普遍有差评的人或物品

展开




夜雨声烦

2019-11-22

c2c平台的例子太形象了 ..




陈朋

2019-11-13

ALS算法没有讲好，连接https://blog.csdn.net/antkillerfarm/article/details/53734658




陈思旭

2019-08-01

老师，加权的最小二乘公式中 rui 是不是 pui？是rui下的二元变量，当rui>0时候，pui=1 ,当rui=0,pui=0.




赖春苹

2019-07-31

有个很不明白的地方就是，隐式反馈的代价函数第一项，也是均方误差么？均方误差一般用于评分预测这种回归问题吧？隐式反馈对应的“点击”、“收藏”、“加购物车”这类的操作不是有限个状态么，不应该是分类问题吗？




real

2019-06-14

这个根本就不是矩阵分解好伐。你可以理解为 userid 和itemid的embedding。实现组织为onehot，在embedding到低纬度。两个field的embedding就对应的 p u，然后去采样。

 2


戏入蝶衣

2019-05-07

老师，上一堂课讲到的预测评分的svd模型不需要负样本，为什么行为预测套用svd就需要负样本呢？如果我们只在用户有过行为的样本上训练模型，会有什么疏忽呢？

 2


shangqiu86

2019-04-29

老师，我理解矩阵分解中，应该是我们对于其中好多元素是未知的，这个未知不代表为0，而负样本其实对应的矩阵中的元素应该确认为0或者定义的负数是么？我们矩阵分解的目的是把矩阵中未知的元素计算出来




shangqiu86

2019-04-29

老师，您好，在您介绍算法的时候是否也推荐下其对应的python或者spark的包，方便我们实践起来




kijiang

2019-03-11

无反馈的样本评分是0，然后被采样到的负样本评分，设为-1吗？

作者回复: 并不是。你这昵称是故意的吗？




易初

2018-05-22

用户和物品是一个pair ，用dssm 深度语意匹配网络是不是更好



