• 林彦
    2018-04-27
    大晚上的,偷偷懒不做产品经理去研究2家公司的实际信息流了。这2个应用我都没安装,平时很少用。根据网上的文章抛个砖头。

    共同点:
    1. Facebook和今日头条都是要通过内容提取,用户和环境的分析找到最匹配的信息;
    2. 根据用户的各种行为来衡量效果;
    3. 都会引入一些无法完全用数据衡量的目标。比如屏蔽广告,屏蔽骚扰帐号,屏蔽有害内容;
    4. 特征提取,特征匹配,用各种机器学习和深度学习的模型。用户标签/画像,内容标签的建立。这些工作后面的机制是相通的;
    5. 实时信息流的更新量大,对性能要求高;
    6. 都会有实验平台和长期跟踪效果的记录平台;
    7. 都有人工介入评估。

    不同点:
    1. Facebook里原创和转发的动作比今日头条更频繁(我的理解),这个动作的衡量会不同;
    2. 今日头条的内容更复杂,种类更丰富,需要提取的特征种类,特征信息和衡量效果的因素更多;
    3. 今日头条的内容是有层级逻辑关系的;
    4. Facebook人之间的关系,互动的影响要比今日头条之间要大;
    5. 今日头条内容团队的中国特色。评估效果时人工介入的更多。
    展开
    
     12
  • 🐱您的好友William...
    2018-10-11
    我认为facebook的根本是社交,头条的根本是内容。所以对于算法和架构的搭建是围绕两个根本不一样的命题开展的,虽然会用到相似的手段去实现各自的目标。
    
     2
  • 微微一笑
    2018-04-27
    脸书生产的都是个性化的内容,基本不会重复!头条是个内容聚合平台,不同来源的数据很多重复
    
     2
  • jt120
    2018-04-27
    关键看生产者和消费者的关系,脸书是大家都会生产消费,头条是只少数人生产,消费多用推,生产多用拉
    
     2
  • fzhyang
    2019-12-10
    传统的信息流产品知识简单按照时间排序 这里是不是有笔误 知识应该是只是?
    
    
  • 宇天飞
    2019-04-06
    请问下,离线得到的模型数据什么时候更新,让实时服务可以使用呢
    
    
  • 帅帅
    2018-09-24
    非常感谢作者,最近在做一个信息流,刚好都能套上:

    输入数据:用户画像、物品画像、行为数据(浏览、点击、播放、购买、关注、分享)
    目标:提升互动率,比如CTR

    排序算法想到用spark的Lr,但是想了想,其实tf的wide/deep也有现成的程序,可以一步到位;

    有两个疑问还没解决:
    1、信息流架构中,不用先召回?
    2、模型为什么需要在线服务,因为我的内容更新不频繁,我直接给每个用户计算好待推送的列表是不是更好?
    展开
    
    
我们在线,来聊聊吧