作者回复: 纸上得来终觉浅,绝知此事要躬行。我理解你是要做些实践类的项目。
首先可以看看诸如Harrington《机器学习实战》这一类的书籍,了解一下从输入到输出完整的过程。专栏里的例子都是toy example,在真实项目里,数据预处理和特征工程这些都是不可或缺的。
有了大体的认识之后,就可以做一些更贴近实际的项目了。Kaggle,还有一些其他的国内的网站都是很好的选择,你可以找一找。里面的项目都是基于真实数据集的完整问题,相当于亲手实战了。
再深入的话就是做真刀真枪的项目了。这种项目离不开垂直领域,需要完全从零开始地分析解决。如果对金融有兴趣,你可以找一些相关的案例看一看,学习这个领域特有的方法技巧,有的放矢。但问题是如果没有企业或者研究背景的话,这种纯实践的横向项目恐怕接触不到。
以上就是我的一点建议,但仅仅是一般化的路径,每个人的基础不同,还需要根据自己的情况找到最合适的道路。
祝你达到心中的目标!
作者回复: 感知器属于全局模型,一套参数适用于所有输入
作者回复: 朴素贝叶斯把属性之间的关联去掉,让属性之间相互独立,让每个样本都可以从单个属性的角度来观察,可以理解成是最简单的分布式表示了。
作者回复: 怎么处理取决于应用场景了。最简单的方法是给对角线元素加个扰动,改善下特征值,这相当于做个岭回归。要是矩阵求逆可以借助奇异值分解。