06|AI模型的构建过程是怎样的?(上)
模型设计
- 深入了解
- 翻译
- 解释
- 总结
本文介绍了AI模型构建过程中的特征工程环节,强调了产品经理和算法工程师之间的紧密合作。文章首先从特征提取入手,详细介绍了数值型特征数据、标签或描述类数据、非结构化数据和网络关系型数据的提取方法。接着阐述了特征选择的过程,包括对特征覆盖度、IV值和稳定性的筛选方法。最后,文章提到了生成训练/测试集的阶段,强调了算法工程师在模型训练前需要将数据分成训练集和测试集。总结来看,本文重点强调了特征工程在AI模型构建中的重要性,以及产品经理和算法工程师在特征工程过程中的合作关系。
《成为 AI 产品经理》,新⼈⾸单¥59
全部留言(39)
- 最新
- 精选
- 悠悠置顶模型设计阶段的PRD文档,是什么样子的,老师可以发一个看看吗
作者回复: 我觉得,需要明确的有: 1、具体的模型输出(即算法目标)。你要解决是一个分类问题还是一个回归问题(输出是一个概率还是一个连续值) 如果是一个概率值,并且是用在分类场景,那还要确定是否需要模型进行二次加工,比如在做高潜用户预测,模型输出的是一个概率值,但这个概率值在业务场景无法使用,所以就还需要映射成具体的用户等级。 2、数据接入。是否有数据依赖,注明已接入的数据,包括数据类型(Hive / MQ),数据量大小,更新频率,Hive表名及格式。 3、服务性能。部署的接口峰值qps、延迟要求、日均UV。 4、验收标准。除了如 KS、AUC 等强模型指标的确定。另外还要以目标为导向编写 PRD 的验收标准,不要拘泥形式。 举个例子,比如在推荐系统的排序环节中,产品经理就要以目标为导向将模型的评估指标写到 PRD 中,如果产品是以提高 CTR 为目标,那么可以使用 CTR 作为衡量排序模型的指标。但在电商场景中,还存在 CVR、GMV、UV 等多个核心指标,并不是一个指标所决定的,所以此时产品经理要根据业务目标来优化排序模型的验收标准,如果公司追求的是 GMV,那么此时的单纯提升 CTR ,在一定程度上只能代表着用户体验的提升。 但这些关注点对于算法工程师来说,就会考虑的很少,因为他们只对模型负责,不对产品负责。但对于产品经理来说,这才能体现你的 PRD 的价值。
2020-12-2662 - 大雷子1、双11、618等促销日,用户会集中下单,促销日前后时间段下单几率较小,这期间30天未下单,不能定义为流失客户; 2、用户历史购买商品类型,如果大型家电、家居类居多,这一类商品购买频率本身就比较低,如果该用户30天未下单,也不能定义为流失客户; 3、用户历史订单评价,如果评价较好,30天未下单也不能定义为流失客户
作者回复: 👍
2020-12-3027 - 悠悠课后讨论 新注册用户、长假期、临近大促消,可能会影响用户下单时间
作者回复: 👍
2020-12-2627 - Miss斑马说了这么多,其实核心就是一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 ---怎么理解这里说的“算法”,是个什么东西?
作者回复: 影响机器学习上限的因素有很多,算法选型也是其中之一。 但这句话的关注点是在说特征工程的重要性。
2021-01-04 - 丸子酱课后问题答疑: 1.时间区段:大促、定时抢购前后无下单行为很正常,应该结合活跃程度、浏览产品和加入购物车等行为总和分析; 2.外界影响:政策、疫情等不可抗力因素导致的不能下单或者快递不可达的情况,不可一刀切为流失用户; 3.用户层:应对用户画像,历史购物行为中,购买奢侈品、电子产品、大型家具等本身频次比较低的产品,不可判断为流失用户,应综合考虑该类产品的使用寿命、用户行为、购物偏好、季节适配性等条件综合判断 4.平台和合作平台极端情况:如用户经常性购买的物品,长期属于断货情况、或者合作的快递终止合作,导致无快递送达等因素、或者平台某功能长期不可使用导致用户不可下单等极端情况2021-01-1215
- AsyDong平均购物周期;月度购物次数和金额环比:如果上个月大量采购完,这个月不太会再次进行采购;购物品类偏好:日用品消费频次高,大小家电消费频次相对较低2020-12-256
- Geek_c95225特征值的提取 稳定性 、iv值、覆盖率 是怎么去定义的?2021-12-235
- Fan老师问下 如果手头上现在没有AI项目,学习了这些理论的话,有没有更好办法去实践,例如可以进行怎么模拟来部分还原真正的AI项目实践。2020-12-2514
- Geek_d7623f特征的IV值和稳定性是怎么计算的?如果按照筛选后剩下的特征比较少,是否还要再挖掘之前未想到的特征? 课后思考:用户购物车中商品数量,可能用户在等待大促活动一起下单。2020-12-253
- Geek7419请问IV值是怎么计算的? 看到结尾了,也没有讲这个指标的计算方式。2021-12-131