作者回复: 是这样的。
作者回复: 比如用户点击物品组成的时序数据,是你说的feature ,经过word2vec(学习算法)之后得到物品的向量,进一步变成用户的向量。就是用户画像的一部分了。
作者回复: 是个大话题,三两句无法表达我那些心里话。
作者回复: 一般是按照分数排序后,矮子中选高的。
作者回复: 骚年,不要急,慢慢来。
作者回复: 给人看和给机器看的用户画像不一样。
作者回复: 哪怕是一张卫生纸,一条底裤,都有它的作用。
作者回复: 两个向量的维度一致:数量一致,每个维度意义一致,就可以去衡量他们的距离远近。
作者回复: 用户画像就是user profile
item profile 则被叫做物品画像。
用户画像被计算出来的部分,通常和item的维度一致,而自然属性部分则各有各的。
作者回复: 减少计算量不是目的。应该是这样理解:
1. 计算机只能处理结构化信息,所以必须结构化才能让计算机去计算。
2. 用结构化的方式让用户表示得越细腻越好。
作者回复: 还是得先收集标注数据。
作者回复: 方法不同。