珊羽
2021-03-17
看了一眼评论,我觉得大部分人都陷入了技术思维,我个人认为这个问题应该要从产品经理的视角来思考,从整个产品设计流程来看,模型选择只是其中的一部分,而不是产品经理关注的全部。 1、产品目标:过滤垃圾评论 2、具体需求:通过算法模型来找出垃圾评论,并过滤掉 3、算法(这部分可以与算法同学沟通) (1)定义目标变量:即是否垃圾评论 (2)定义垃圾评论:即什么是垃圾评论,如广告? (3)算法选型:这个问题本质上是个分类问题,可以通过聚类算法对评论进行分类,找出垃圾评论 (4)确定样本:选定一部分数据,如果是有监督的学习需进行标注,如果是无监督学习则不需要标注,这里要根据算法同学最终选定的模型来定 (5)训练模型 (6)验证模型 4、系统工程侧的开发任务:即模型的运用,模型上线后,工程侧的同学如何通过模型过滤垃圾评论 5、核心指标:即算法最终要达成的目标
24
悠悠
2021-01-18
1、用聚类算法将海量的评论进行分类; 2、对分类的评论进行标注,是否为垃圾评论; 3、用朴素贝叶斯训练模型。
6
悠悠
2021-01-18
期待后面的项目,希望能转成功
共 1 条评论
3
阿小
2021-04-07
首先,业务需求沟通,1)明确垃圾评论的定义、是否有初步的分类想法,是否有关键词规则等;是否有数据标注?判定可容忍的误差范围等。2)过滤后是否需要处置?3)周期有多长? 其次,明确业务的分类目标和项目周期后,和算法同学进行沟通,就实际数据情况、业务效果预期进行算法设计讨论、例如如果是有标注的二分类问题可以用TextCNN、无标注则考虑用K- Means等,当然文本类数据需要做命名实体识别等处理。同工程化产品研发的同学讨论实际分类后的处置实现,例如如果期望基于某个分类自动回复等。 接着,在算法同学出来算法预研方案后制定产品计划,跟进产品、算法研发进度。 最后,验收模型、产品,发版。
1
BAYBREEZE
2021-01-21
我看到这些算法,和数据挖掘的算法是一样的,让我差点把AI与数据挖掘搞混了。 请问老师,机器学习和数据挖掘的区别是什么呢,都是一样的算法情况下,还有哪些区别? 望回复
1
王小玥
2023-03-20
来自广东
“产品经理决定做一个事情的出发点,是通过技术来实现业务价值,有时候技术如何做反而不重要” “产品经理需要的是知识的广度,需要打通上下游与横向部门” 这两句话说的深有感触。
Pale Blue
2021-09-21
假如,你现在是一家电商平台的产品经理,负责点评系统的产品设计,现在有一个需求是要通过计算将海量评论中的垃圾评论(如,打广告的情况)过滤出来,你会怎么思考和设计产品呢? 1. 目标:过滤垃圾评论 2. 用算法模型过滤掉垃圾评论 3.实现步骤: (1)定义垃圾评论 (2)数据处理阶段:针对评论文本数据进行处理,进行分词->计算词权重->去掉停用词(https://baike.baidu.com/item/tf-idf/8816134?fr=aladdin) (3)使用朴素贝叶斯分类器,并且进行训练 (4)验证分类模型
Yesss!
2021-01-31
首先考虑的是:项目周期是否紧张、相关算法资源是否充足。我假设这里是以节省成本以最优法进行解释: 1、这是一个分类问题 2、可以用我学过的 k-means 算法 进行分类。随意采取几个质心 - 计算每个数据点与质心的距离 -均值作为下一个质心的位置 - 新质心与老质心距离不再变化或小于某一个阈值。结束算法。筛选出文本聚类 选择k-means原因:运算效率高、可解释性强、容易实现、大部分聚类都能解决 3、使用朴素贝叶斯算法(适合垃圾评论分类)-查看了悠悠的评论 选择朴素贝叶碎算法原因:算法资源占用不高、构建模型快。评论属于互相独立性比较高的数据