极客时间
21天打卡行动 50/21
<<机器学习40讲/12>>正则化处理:收缩方法与边际化
今日所学:
1,过拟合就是模型过于复杂,复杂到削弱了它的泛化性能,
2,正则化(regularization)是用于抑制过拟合的方法的统称,通过动态调整估计参数的取值来降低模型的复杂度,以偏差的增加为代价来换取方差的下降;
3,贝叶斯主义对正则化的理解:正则化就是引入关于参数的先验信息。
4,利用贝叶斯定理可以得出,最可能的超参数取值应该让下面的后验概率最大化;
5,贝叶斯边际化:价值就在于计算出的结果就是最优的结果。
6, Python 库都可以直接实现不同的正则化处理。在 Scikit-learn 库中,线性模型模块 linear_model 中的 Lasso 类和 Ridge 类就可以实现 l_1 正则化和 l_2 正则化。
重点:
正则化的作用是抑制过拟合,通过增加偏差来降低方差,提升模型的泛化性能;
正则化项的作用是对解空间添加约束,在约束范围内寻找产生最小误差的系数;
频率视角下的正则化与贝叶斯视角下的边际化作用相同;
边际化对未知的参数和超参数进行积分以消除它们的影响,天然具有模型选择的功能
展开