极客时间-轻松学习，高效学习-极客邦

悠悠
置顶
2020-12-26
模型设计阶段的PRD文档，是什么样子的，老师可以发一个看看吗
作者回复: 我觉得，需要明确的有： 1、具体的模型输出（即算法目标）。你要解决是一个分类问题还是一个回归问题（输出是一个概率还是一个连续值）如果是一个概率值，并且是用在分类场景，那还要确定是否需要模型进行二次加工，比如在做高潜用户预测，模型输出的是一个概率值，但这个概率值在业务场景无法使用，所以就还需要映射成具体的用户等级。 2、数据接入。是否有数据依赖，注明已接入的数据，包括数据类型（Hive / MQ），数据量大小，更新频率，Hive表名及格式。 3、服务性能。部署的接口峰值qps、延迟要求、日均UV。 4、验收标准。除了如 KS、AUC 等强模型指标的确定。另外还要以目标为导向编写 PRD 的验收标准，不要拘泥形式。举个例子，比如在推荐系统的排序环节中，产品经理就要以目标为导向将模型的评估指标写到 PRD 中，如果产品是以提高 CTR 为目标，那么可以使用 CTR 作为衡量排序模型的指标。但在电商场景中，还存在 CVR、GMV、UV 等多个核心指标，并不是一个指标所决定的，所以此时产品经理要根据业务目标来优化排序模型的验收标准，如果公司追求的是 GMV，那么此时的单纯提升 CTR ，在一定程度上只能代表着用户体验的提升。但这些关注点对于算法工程师来说，就会考虑的很少，因为他们只对模型负责，不对产品负责。但对于产品经理来说，这才能体现你的 PRD 的价值。
51
大雷子
2020-12-30
1、双11、618等促销日，用户会集中下单，促销日前后时间段下单几率较小，这期间30天未下单，不能定义为流失客户； 2、用户历史购买商品类型，如果大型家电、家居类居多，这一类商品购买频率本身就比较低，如果该用户30天未下单，也不能定义为流失客户； 3、用户历史订单评价，如果评价较好，30天未下单也不能定义为流失客户
作者回复: 👍
22
悠悠
2020-12-26
课后讨论新注册用户、长假期、临近大促消，可能会影响用户下单时间
作者回复: 👍
共 2 条评论
6
Miss斑马
2021-01-04
说了这么多，其实核心就是一句话：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。 ---怎么理解这里说的“算法”，是个什么东西？
作者回复: 影响机器学习上限的因素有很多，算法选型也是其中之一。但这句话的关注点是在说特征工程的重要性。
丸子酱
2021-01-12
课后问题答疑： 1.时间区段：大促、定时抢购前后无下单行为很正常，应该结合活跃程度、浏览产品和加入购物车等行为总和分析； 2.外界影响：政策、疫情等不可抗力因素导致的不能下单或者快递不可达的情况，不可一刀切为流失用户； 3.用户层：应对用户画像，历史购物行为中，购买奢侈品、电子产品、大型家具等本身频次比较低的产品，不可判断为流失用户，应综合考虑该类产品的使用寿命、用户行为、购物偏好、季节适配性等条件综合判断 4.平台和合作平台极端情况：如用户经常性购买的物品，长期属于断货情况、或者合作的快递终止合作，导致无快递送达等因素、或者平台某功能长期不可使用导致用户不可下单等极端情况
10
AsyDong
2020-12-25
平均购物周期；月度购物次数和金额环比：如果上个月大量采购完，这个月不太会再次进行采购；购物品类偏好：日用品消费频次高，大小家电消费频次相对较低
6
Geek_c95225
2021-12-23
特征值的提取稳定性、iv值、覆盖率是怎么去定义的？
5
Fan
2020-12-25
老师问下如果手头上现在没有AI项目，学习了这些理论的话，有没有更好办法去实践，例如可以进行怎么模拟来部分还原真正的AI项目实践。
4
Geek_d7623f
2020-12-25
特征的IV值和稳定性是怎么计算的？如果按照筛选后剩下的特征比较少，是否还要再挖掘之前未想到的特征？课后思考：用户购物车中商品数量，可能用户在等待大促活动一起下单。
3
Geek7419
2021-12-13
请问IV值是怎么计算的？看到结尾了，也没有讲这个指标的计算方式。
1