机器学习40讲
王天一
工学博士,副教授
立即订阅
8030 人已学习
课程目录
已完结 44 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 打通修炼机器学习的任督二脉
免费
机器学习概观 (10讲)
01 | 频率视角下的机器学习
02 | 贝叶斯视角下的机器学习
03 | 学什么与怎么学
04 | 计算学习理论
05 | 模型的分类方式
06 | 模型的设计准则
07 | 模型的验证方法
08 | 模型的评估指标
09 | 实验设计
10 | 特征预处理
统计机器学习模型 (18讲)
11 | 基础线性回归:一元与多元
12 | 正则化处理:收缩方法与边际化
13 | 线性降维:主成分的使用
14 | 非线性降维:流形学习
15 | 从回归到分类:联系函数与降维
16 | 建模非正态分布:广义线性模型
17 | 几何角度看分类:支持向量机
18 | 从全局到局部:核技巧
19 | 非参数化的局部模型:K近邻
20 | 基于距离的学习:聚类与度量学习
21 | 基函数扩展:属性的非线性化
22 | 自适应的基函数:神经网络
23 | 层次化的神经网络:深度学习
24 | 深度编解码:表示学习
25 | 基于特征的区域划分:树模型
26 | 集成化处理:Boosting与Bagging
27 | 万能模型:梯度提升与随机森林
总结课 | 机器学习的模型体系
概率图模型 (14讲)
28 | 最简单的概率图:朴素贝叶斯
29 | 有向图模型:贝叶斯网络
30 | 无向图模型:马尔可夫随机场
31 | 建模连续分布:高斯网络
32 | 从有限到无限:高斯过程
33 | 序列化建模:隐马尔可夫模型
34 | 连续序列化模型:线性动态系统
35 | 精确推断:变量消除及其拓展
36 | 确定近似推断:变分贝叶斯
37 | 随机近似推断:MCMC
38 | 完备数据下的参数学习:有向图与无向图
39 | 隐变量下的参数学习:EM方法与混合模型
40 | 结构学习:基于约束与基于评分
总结课 | 贝叶斯学习的模型体系
结束语 (1讲)
结课 | 终有一天,你将为今天的付出骄傲
机器学习40讲
登录|注册

06 | 模型的设计准则

王天一 2018-06-16
上学时你一定过学习新知识的经历:首先要结合老师的讲解进行消化理解,接着要做些练习题找到问题并加强巩固,最后通过考试来检验学习的最终效果。机器学习需要根据问题特点和已有数据确定具有最强解释性或预测力的模型,其过程也可以划分为类似于“学习 - 练习 - 考试”这样的三个阶段,每个阶段的目标和使用的资源可以归纳如下:
模型拟合(model fitting):利用训练数据集(training set)对模型的普通参数进行拟合;
模型选择(model selection):利用验证数据集(validation set)对模型的超参数进行调整,筛选出性能最好的模型;
模型评价(model assessment):利用测试数据集(test set)来估计筛选出的模型在未知数据上的真实性能。
接下来的三篇文章将分别围绕模型处理这三个阶段展开论述,首先将从模型拟合开始。
虽然模型拟合的任务是计算未知的参数,但它还要解决一个更重要的问题,就是在拟合参数前确定模型的形式,或者说到底要拟合哪些参数。模型拟合本身只是简单的数学问题,交给计算机就可以万事大吉,可模型设计却颇有门道,涉及到更多的思考:一方面,模型的合理性很大程度上取决于待解决问题本身的特征;另一方面,模型的复杂度也要和问题的复杂度相匹配。在机器学习中,对这两个基本准则的理解催生了两个基本的规律,分别是无免费午餐定理奥卡姆剃刀原则
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《机器学习40讲》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(9)

  • 林彦
    开始模型的误差比较大,也就是偏差较大,需要先解决欠拟合的问题。数据量不够大的情况下,容易产生过拟合,这时就要考虑降低方差,减小过拟合。从训练的步骤看,欠拟合需要先解决。

    作者回复: 赞同,私以为欠拟合的危害更大

    2018-06-16
    3
  • hanlimo
    应该还是先欠拟合吧,业务先跑起来首先要保证不“丢”数据,过拟合的问题可以随着业务的深入逐步完善。

    作者回复: 赞同

    2018-09-17
    1
  • 吹胡子爷爷
    老师,我看这个有点费劲,有没有先修课推荐?看来我得去复习复习…不对,是重新学习学习

    作者回复: 可以参考前面的基础课专栏哈,后面我会在总结文章里推几本参考书,有些有中译,可以读一读。不需要急于求成,看一点懂一点就是收获。

    2018-07-30
    1
  • Genesis 🌟
    王老师您好老师,我是一名开学研一的学生,导师让掌握深度学习,请问王老师以后会开这方面的课程吗 或者老师有什么推荐的资源适合初学者看一下

    作者回复: 了解深度学习可以先看看Bengio的Learning deep architecture for AI了解下思想,再读深度学习那本大书,oreilly的fundamentals of deep learning也可以看看。还有就是论文了。

    2018-06-17
    1
  • 张一鸣
    老师,我觉得直接这么讲没有实际的例子或者简单的应用太宽泛了,对于初级和高级的过度,理解起来看不到那么深,也没法理解的那么直观
    2019-11-28
  • King5
    模型拟合适合非数字类的吗,数字类的都可以用传统的计算方法,感觉没必要套上机器学习的外套

    作者回复: 非数字类最终也要转成数字类,要不然没法度量。

    2018-07-23
  • 你不是我
    内容很精简,但是在吃下这些知识后,又不知道具体如何实现。老师可不可以在文章中,添加一些操作案例,加以解释,让知识和实际有一个很好的切入点。

    作者回复: 在后面介绍不同模型时会有相应的toy example。

    2018-07-05
  • 青刀快马
    那具体如何创建一个模型呢?
    2018-06-24
  • 袁明泉
    Bagging可以降低variance,boosting可以降低bias。有没有可能把两个方法同时用,同时降低bias和variance呢?

    作者回复: Boosting之后得到较好的模型后,再做bagging就不会有什么提升了,好事成双终归是可遇不可求。

    2018-06-16
收起评论
9
返回
顶部