• 悠悠
    置顶
    2020-12-26
    模型设计阶段的PRD文档,是什么样子的,老师可以发一个看看吗

    作者回复: 我觉得,需要明确的有: 1、具体的模型输出(即算法目标)。你要解决是一个分类问题还是一个回归问题(输出是一个概率还是一个连续值) 如果是一个概率值,并且是用在分类场景,那还要确定是否需要模型进行二次加工,比如在做高潜用户预测,模型输出的是一个概率值,但这个概率值在业务场景无法使用,所以就还需要映射成具体的用户等级。 2、数据接入。是否有数据依赖,注明已接入的数据,包括数据类型(Hive / MQ),数据量大小,更新频率,Hive表名及格式。 3、服务性能。部署的接口峰值qps、延迟要求、日均UV。 4、验收标准。除了如 KS、AUC 等强模型指标的确定。另外还要以目标为导向编写 PRD 的验收标准,不要拘泥形式。 举个例子,比如在推荐系统的排序环节中,产品经理就要以目标为导向将模型的评估指标写到 PRD 中,如果产品是以提高 CTR 为目标,那么可以使用 CTR 作为衡量排序模型的指标。但在电商场景中,还存在 CVR、GMV、UV 等多个核心指标,并不是一个指标所决定的,所以此时产品经理要根据业务目标来优化排序模型的验收标准,如果公司追求的是 GMV,那么此时的单纯提升 CTR ,在一定程度上只能代表着用户体验的提升。 但这些关注点对于算法工程师来说,就会考虑的很少,因为他们只对模型负责,不对产品负责。但对于产品经理来说,这才能体现你的 PRD 的价值。

    
    51
  • 大雷子
    2020-12-30
    1、双11、618等促销日,用户会集中下单,促销日前后时间段下单几率较小,这期间30天未下单,不能定义为流失客户; 2、用户历史购买商品类型,如果大型家电、家居类居多,这一类商品购买频率本身就比较低,如果该用户30天未下单,也不能定义为流失客户; 3、用户历史订单评价,如果评价较好,30天未下单也不能定义为流失客户

    作者回复: 👍

    
    22
  • 悠悠
    2020-12-26
    课后讨论 新注册用户、长假期、临近大促消,可能会影响用户下单时间

    作者回复: 👍

    共 2 条评论
    6
  • Miss斑马
    2021-01-04
    说了这么多,其实核心就是一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 ---怎么理解这里说的“算法”,是个什么东西?

    作者回复: 影响机器学习上限的因素有很多,算法选型也是其中之一。 但这句话的关注点是在说特征工程的重要性。

    
    
  • 丸子酱
    2021-01-12
    课后问题答疑: 1.时间区段:大促、定时抢购前后无下单行为很正常,应该结合活跃程度、浏览产品和加入购物车等行为总和分析; 2.外界影响:政策、疫情等不可抗力因素导致的不能下单或者快递不可达的情况,不可一刀切为流失用户; 3.用户层:应对用户画像,历史购物行为中,购买奢侈品、电子产品、大型家具等本身频次比较低的产品,不可判断为流失用户,应综合考虑该类产品的使用寿命、用户行为、购物偏好、季节适配性等条件综合判断 4.平台和合作平台极端情况:如用户经常性购买的物品,长期属于断货情况、或者合作的快递终止合作,导致无快递送达等因素、或者平台某功能长期不可使用导致用户不可下单等极端情况
    
    10
  • AsyDong
    2020-12-25
    平均购物周期;月度购物次数和金额环比:如果上个月大量采购完,这个月不太会再次进行采购;购物品类偏好:日用品消费频次高,大小家电消费频次相对较低
    
    6
  • Geek_c95225
    2021-12-23
    特征值的提取 稳定性 、iv值、覆盖率 是怎么去定义的?
    
    5
  • Fan
    2020-12-25
    老师问下 如果手头上现在没有AI项目,学习了这些理论的话,有没有更好办法去实践,例如可以进行怎么模拟来部分还原真正的AI项目实践。
    
    4
  • Geek_d7623f
    2020-12-25
    特征的IV值和稳定性是怎么计算的?如果按照筛选后剩下的特征比较少,是否还要再挖掘之前未想到的特征? 课后思考:用户购物车中商品数量,可能用户在等待大促活动一起下单。
    
    3
  • Geek7419
    2021-12-13
    请问IV值是怎么计算的? 看到结尾了,也没有讲这个指标的计算方式。
    
    1