• 你这个狗东东
    2018-03-12
    写的真好。我们有时候在做用户画像就跟做BP一样,纯粹是为了彰显我们的用户净值多高,我们的市场定位多么明确。其实推荐系统里的用户画像,是根据目标来定,比如你需要提高内容的点击率,需要了解的维度可能是用户以往阅读内容的维度,用户订阅的分类维度……而其他无关紧要的标签其实不重要

    作者回复: 是这样的。

    
     15
  • yxj🚩
    2018-03-12
    刑老师,我理解的第三类方法用户行为画像机器学习也要通过前两种方法堆积数据或者人为去选择定义输入的特征(feature),然后再通过机器学习或者深度学习的算法黑箱学习匹配以求得一个准确率很高的算法,但我们学到的是算法,要对用户画像还是要这些数据做为这个学得的算法输入该用户的feature向量才能准确画出。

    作者回复: 比如用户点击物品组成的时序数据,是你说的feature ,经过word2vec(学习算法)之后得到物品的向量,进一步变成用户的向量。就是用户画像的一部分了。

    
     11
  • Mars
    2018-05-26
    目前我们画像的策略是将用户画像分为四类:基础类,行为类,衍生类和模型类,首末分别对应到老师讲的查户口和黑箱,中间两个一起是统计类。这里行为类的直接统计的结果,衍生类的通过行为类二次计算的行为结果。主要目的是支撑运营和推荐,看了这节,确实要多想想,不能为了用户画像而画像,要用推荐的结果去反推优化画像。
    顺便请教下老师,画像除了我上面提到的两个目的,还有其他目的或者还是其他什么的副产品嘛?
    
     8
  • 谢烟客
    2018-03-12
    1. 查户口做记录一个无奈之处是:总要给公司领导一个交代。

    2. 先不抱怨领导不理解推荐系统,反转位置,非技术体系领导如何考核管理推荐系统团队?

    作者回复: 是个大话题,三两句无法表达我那些心里话。

    
     7
  • 章光辉
    2019-07-19
    画像是画像,特征是特征,老师你把这两个概念给强行绑定成一个,我觉得是不太妥当的。

    由各种各样的数据,经过清洗、统计、预处理、特征工程等方式,得到了用户的特征。在这个基础上,分出两条路,一条路是对特征的归纳和总结,得到用户画像,这个是给人看的,用于运营和产品了解用户和获取新客户;另一条路是通过建模的手段,得到用户对某类物品的偏好预测,这个是给机器看的,用于精细化地推荐。

    两者本身相辅相成。
    展开
    
     6
  • XzAmrzs
    2018-03-12
    您好,讲的很专业,但是这里“每个因素相乘后再相加,就得到每一个大排挡的评分了”有点没看懂,比如(3,5,4)是大排档,“我”的向量是(2,3,5),那么相乘后的匹配评分是2×3+5×3+5×4=41吗?那么是怎么个匹配标准?这里是分数越高越匹配还是越低越匹配?照我的想法应该是当两向量平行的时候最匹配才对

    作者回复: 一般是按照分数排序后,矮子中选高的。

     1
     6
  • holysky
    2018-03-13
    已买,赶紧更新啊,我要从0开始推荐体统了

    作者回复: 骚年,不要急,慢慢来。

    
     4
  • 叶晓锋
    2018-03-12
    我们现在就有一个用户画像系统,而且还有一个后台进行管理和维护,画像系统其实是一个标签系统,分成九大类数百个标签,提供给产品,运营,管理人员查看。我们的模型有时也会部分标签数据,但基本还会在此基础上做演算,例如归一化,独热编码等。

    作者回复: 给人看和给机器看的用户画像不一样。

    
     4
  • 小鑫
    2018-03-26
    能讲讲如何从历史行为数据中挖掘(产生)标签么?标签是事先拍脑袋定的,还是通过算法自动产生的?有监督学习不都是事先定义好标签么?
    
     3
  • 185
    2018-03-15
    酷炫画像也很好,能让土豪老板或小白领导作出马上签合同的决定,现在我想到了echart 😂

    作者回复: 哪怕是一张卫生纸,一条底裤,都有它的作用。

    
     3
  • jt120
    2018-03-14
    之前看过推荐系统实战
    对这里的大排档例子有疑问,如果是UC,那么是找相似用户,如果是IC,是找相似物品,这里的例子,为什么是直接找用户和物品的相似,这两个实体,是不是没可比性

    作者回复: 两个向量的维度一致:数量一致,每个维度意义一致,就可以去衡量他们的距离远近。

     1
     3
  • Lotna
    2019-08-21
    计算大排档评分的地方有问题,推荐大排档应该是计算用户向量和大排档向量的相似度,而不是元素相乘再相加
     1
     2
  • 吴峰
    2018-07-19
    这里用户画像的范畴,除了user的向量化,是否也包含item的向量化。毕竟item有哪些维度、如何量化,也存在拍脑袋的空间。

    作者回复: 用户画像就是user profile
    item profile 则被叫做物品画像。

    用户画像被计算出来的部分,通常和item的维度一致,而自然属性部分则各有各的。

    
     2
  • 惜心(伟祺)
    2018-03-24
    用户画像是对用户特征的向量化 这个定义很好
    把用户画像的定义泛化了 不一定非得人懂的标签才是用户画像 具体的维度跟目的走 在这个目的下描述用户的特征都是用户的画像标签
    
     2
  • auroroa
    2018-03-23
    用户画像两个目的:
    1、向量化后让机器读懂每个用户
    2、召回阶段减少计算量

    可以这么理解吗???

    作者回复: 减少计算量不是目的。应该是这样理解:
    1. 计算机只能处理结构化信息,所以必须结构化才能让计算机去计算。
    2. 用结构化的方式让用户表示得越细腻越好。

    
     2
  • 技术猿
    2018-08-13
    邢老师,用户画像向量做好啦,如何去跟物品做匹配,对应的应该是一个区间还是一个固定的物品?
    还有就是用户画像维度的定义主要依据是什么
    
     1
  • 会飞的书2008
    2018-05-12
    「查户口」里的分析购买历史、阅读历史的操作,和「堆数据」中分析历史数据挖掘兴趣标签,这两个是不是有交叉重叠的?
    
     1
  • 余妮娜
    2018-03-24
    那问题来了,运营到底要怎么跟推荐系统的大数据/机器学习演算法工程师合作呢?他们一句这用户画像不是给人看的,运营就没辄了吗?
    
     1
  • 黄鸿强
    2018-03-20
    邢老师,我们产品是款唱歌类app,现在在做画像时年龄这个维度非常难收集到,从用户演唱歌曲来看没有很明显的界限,有没有什么好的建议?

    作者回复: 还是得先收集标注数据。

    
     1
  • 栈
    2018-03-17
    隐语义模型和矩阵分解有什么区别?我的理解是,它们是同一个东西的两个不同名称而已。

    作者回复: 方法不同。

    
     1
我们在线,来聊聊吧