极客时间-轻松学习，高效学习-极客邦

RZ_diversity 置顶

2017-10-19

我认为是第一步，如果针对现实问题的抽象出现了偏差，对抽象设定的假设有问题的话，后续步骤再怎么高效求解参数，评估模型准确性都没办法改正第一步出现的问题。因为模型实际解决的domain已经不一样了。



 11
damonhao 置顶

2017-10-18

最容易出问题的是对现实问题的抽象。如果抽象成功，在数学的范围内求解都是比较有保证的。ps：其实我是来抛砖引玉的。。。



 5
橙子

2017-12-14

三步套路可以总结为：
1. 提出模型
2. 求解模型
3. 评估模型
如果求解的模型没有很好地解决问题，我觉得应该从两种方面考虑：如果模型在训练集的评估误差过大，这就是欠拟合，问题很有可能出在第一步，模型的复杂度不够，模型对问题的模拟不够准确；如果模型在训练集的评估误差比较小，但是在测试集的评估误差过大，这就是过拟合，问题就很可能出现在第二步。

展开

作者回复: 你总结得很有道理。



 29
鬼猫猫

2017-11-08

这总结得太到位了，作为对机器学习有兴趣的外行人，虽然读了很多书，教程，但还是在云里雾里，看了本篇文章之后，对机器学习有了个整体上的认识。这个专栏订的太值了。

作者回复: 谢谢。



 3
JIA

2017-10-18

针对今天的思考题，我觉得最容易出问题的地方就是最重要的第一步，弄清楚模型和现实的联系。如果这一步有问题，那后面做得再好也是白费，方向就错了，当然没办法解决问题。



 2
mortimer

2018-10-04

虽然直觉上我也认为是第一步模型容易出问题,但是我在做人脸聚类的经验恰恰是困在第三部----我们花了大量的时间和精力,来设计评估数据模型的准确性,中间可能有硬编码导致的异常结果;也可能是最初设想的模型不够充分导致结果;更有我们设计出一些组合性的数学模型,就连显而易见的数学意义都找不到了,也就更加不好评估.
所以啊,第三步,如果评价模型和算法反而是最容易出问题,也需要反复检查,验证的.



 1
孤帆

2018-03-04

老师没有提标注，在《统计机器学习方法》中，周航老师将监督学习分为分类、回归、标注。而老师没有提“标注”，请问是什么原因呢？



 1
套码的汉子

2017-12-07

实际应用中，应该是第一步来背锅的几率较大。第三步评估的标准，往往生产环境已经决定。而作者也说，第二步已经有许多现成算法，在实际开发中改进的空间不大。所以，我以前参与开发的测量软件都提供几个算法，一个算法测不准技术支持就会让客户换一个，直到测得准为止。。。

作者回复: 的确需要从第一步多找原因。



 1
吴文敏

2017-10-19

最容易出问题应该是假设，也就是说现实的问题与所用模型的假设不一致。



 1
黄德平

2018-11-26

好的开始是成功的一半，第一步至关重要。
提出合理的模型，对问题的本质做合理的抽象是最关键的一步，结果的好坏往往从最开始就决定了




帅帅

2018-10-20

如果模型效果不好，数据的问题往往会比较大；

如果欠拟合，那一般是模型的容量问题，这个比较简单，换用更大容量的算法即可；
如果过拟合，那很可能是数据量太小了，需要去找寻提取更多的特征输入；




海滨

2018-03-01

刚订这个专栏，才读了几篇文章，就觉得已经值回票价，很赞～




udisyue

2017-10-21

最重要的是第一步定义模型，最初定义的模型不够准确，验证结果也就要有偏差，所以才需要很多手段例如正则化等来对模型修正




gg

2017-10-17

厉害厉害



