RZ_diversity
置顶
2017-10-19
我认为是第一步,如果针对现实问题的抽象出现了偏差,对抽象设定的假设有问题的话,后续步骤再怎么高效求解参数,评估模型准确性都没办法改正第一步出现的问题。因为模型实际解决的domain已经不一样了。
11
damonhao
置顶
2017-10-18
最容易出问题的是对现实问题的抽象。如果抽象成功,在数学的范围内求解都是比较有保证的。ps:其实我是来抛砖引玉的。。。
5
橙子
2017-12-14
三步套路可以总结为:
1. 提出模型
2. 求解模型
3. 评估模型
如果求解的模型没有很好地解决问题,我觉得应该从两种方面考虑:如果模型在训练集的评估误差过大,这就是欠拟合,问题很有可能出在第一步,模型的复杂度不够,模型对问题的模拟不够准确;如果模型在训练集的评估误差比较小,但是在测试集的评估误差过大,这就是过拟合,问题就很可能出现在第二步。
展开
作者回复: 你总结得很有道理。
29
鬼猫猫
2017-11-08
这总结得太到位了,作为对机器学习有兴趣的外行人,虽然读了很多书,教程,但还是在云里雾里,看了本篇文章之后,对机器学习有了个整体上的认识。这个专栏订的太值了。
作者回复: 谢谢。
3
JIA
2017-10-18
针对今天的思考题,我觉得最容易出问题的地方就是最重要的第一步,弄清楚模型和现实的联系。如果这一步有问题,那后面做得再好也是白费,方向就错了,当然没办法解决问题。
2
mortimer
2018-10-04
虽然直觉上我也认为是第一步模型容易出问题,但是我在做人脸聚类的经验恰恰是困在第三部----我们花了大量的时间和精力,来设计评估数据模型的准确性,中间可能有硬编码导致的异常结果;也可能是最初设想的模型不够充分导致结果;更有我们设计出一些组合性的数学模型,就连显而易见的数学意义都找不到了,也就更加不好评估.
所以啊,第三步,如果评价模型和算法反而是最容易出问题,也需要反复检查,验证的.
1
孤帆
2018-03-04
老师没有提标注,在《统计机器学习方法》中,周航老师将监督学习分为分类、回归、标注。而老师没有提“标注”,请问是什么原因呢?
1
套码的汉子
2017-12-07
实际应用中,应该是第一步来背锅的几率较大。第三步评估的标准,往往生产环境已经决定。而作者也说,第二步已经有许多现成算法,在实际开发中改进的空间不大。所以,我以前参与开发的测量软件都提供几个算法,一个算法测不准技术支持就会让客户换一个,直到测得准为止。。。
作者回复: 的确需要从第一步多找原因。
1
吴文敏
2017-10-19
最容易出问题应该是假设,也就是说现实的问题与所用模型的假设不一致。
1
黄德平
2018-11-26
好的开始是成功的一半,第一步至关重要。
提出合理的模型,对问题的本质做合理的抽象是最关键的一步,结果的好坏往往从最开始就决定了
帅帅
2018-10-20
如果模型效果不好,数据的问题往往会比较大;
如果欠拟合,那一般是模型的容量问题,这个比较简单,换用更大容量的算法即可;
如果过拟合,那很可能是数据量太小了,需要去找寻提取更多的特征输入;
海滨
2018-03-01
刚订这个专栏,才读了几篇文章,就觉得已经值回票价,很赞~
udisyue
2017-10-21
最重要的是第一步定义模型,最初定义的模型不够准确,验证结果也就要有偏差,所以才需要很多手段例如正则化等来对模型修正
gg
2017-10-17
厉害厉害
我们在线,来聊聊吧
✕
您好,当前有专业客服人员在线,让我们来帮助您吧。
我们在线,来聊聊吧