• RZ_diversity 置顶
    2017-10-19
    我认为是第一步,如果针对现实问题的抽象出现了偏差,对抽象设定的假设有问题的话,后续步骤再怎么高效求解参数,评估模型准确性都没办法改正第一步出现的问题。因为模型实际解决的domain已经不一样了。
    
     11
  • damonhao 置顶
    2017-10-18
    最容易出问题的是对现实问题的抽象。如果抽象成功,在数学的范围内求解都是比较有保证的。ps:其实我是来抛砖引玉的。。。
    
     5
  • 橙子
    2017-12-14
    三步套路可以总结为:
    1. 提出模型
    2. 求解模型
    3. 评估模型
    如果求解的模型没有很好地解决问题,我觉得应该从两种方面考虑:如果模型在训练集的评估误差过大,这就是欠拟合,问题很有可能出在第一步,模型的复杂度不够,模型对问题的模拟不够准确;如果模型在训练集的评估误差比较小,但是在测试集的评估误差过大,这就是过拟合,问题就很可能出现在第二步。
    展开

    作者回复: 你总结得很有道理。

    
     29
  • 鬼猫猫
    2017-11-08
    这总结得太到位了,作为对机器学习有兴趣的外行人,虽然读了很多书,教程,但还是在云里雾里,看了本篇文章之后,对机器学习有了个整体上的认识。这个专栏订的太值了。

    作者回复: 谢谢。

    
     3
  • JIA
    2017-10-18
    针对今天的思考题,我觉得最容易出问题的地方就是最重要的第一步,弄清楚模型和现实的联系。如果这一步有问题,那后面做得再好也是白费,方向就错了,当然没办法解决问题。
    
     2
  • mortimer
    2018-10-04
    虽然直觉上我也认为是第一步模型容易出问题,但是我在做人脸聚类的经验恰恰是困在第三部----我们花了大量的时间和精力,来设计评估数据模型的准确性,中间可能有硬编码导致的异常结果;也可能是最初设想的模型不够充分导致结果;更有我们设计出一些组合性的数学模型,就连显而易见的数学意义都找不到了,也就更加不好评估.
    所以啊,第三步,如果评价模型和算法反而是最容易出问题,也需要反复检查,验证的.
    
     1
  • 孤帆
    2018-03-04
    老师没有提标注,在《统计机器学习方法》中,周航老师将监督学习分为分类、回归、标注。而老师没有提“标注”,请问是什么原因呢?
    
     1
  • 套码的汉子
    2017-12-07
    实际应用中,应该是第一步来背锅的几率较大。第三步评估的标准,往往生产环境已经决定。而作者也说,第二步已经有许多现成算法,在实际开发中改进的空间不大。所以,我以前参与开发的测量软件都提供几个算法,一个算法测不准技术支持就会让客户换一个,直到测得准为止。。。

    作者回复: 的确需要从第一步多找原因。

    
     1
  • 吴文敏
    2017-10-19
    最容易出问题应该是假设,也就是说现实的问题与所用模型的假设不一致。
    
     1
  • 黄德平
    2018-11-26
    好的开始是成功的一半,第一步至关重要。
    提出合理的模型,对问题的本质做合理的抽象是最关键的一步,结果的好坏往往从最开始就决定了
    
    
  • 帅帅
    2018-10-20
    如果模型效果不好,数据的问题往往会比较大;

    如果欠拟合,那一般是模型的容量问题,这个比较简单,换用更大容量的算法即可;
    如果过拟合,那很可能是数据量太小了,需要去找寻提取更多的特征输入;
    
    
  • 海滨
    2018-03-01
    刚订这个专栏,才读了几篇文章,就觉得已经值回票价,很赞~
    
    
  • udisyue
    2017-10-21
    最重要的是第一步定义模型,最初定义的模型不够准确,验证结果也就要有偏差,所以才需要很多手段例如正则化等来对模型修正
    
    
  • gg
    2017-10-17
    厉害厉害
    
    
我们在线,来聊聊吧