机器学习40讲
王天一
工学博士,副教授
立即订阅
8040 人已学习
课程目录
已完结 44 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 打通修炼机器学习的任督二脉
免费
机器学习概观 (10讲)
01 | 频率视角下的机器学习
02 | 贝叶斯视角下的机器学习
03 | 学什么与怎么学
04 | 计算学习理论
05 | 模型的分类方式
06 | 模型的设计准则
07 | 模型的验证方法
08 | 模型的评估指标
09 | 实验设计
10 | 特征预处理
统计机器学习模型 (18讲)
11 | 基础线性回归:一元与多元
12 | 正则化处理:收缩方法与边际化
13 | 线性降维:主成分的使用
14 | 非线性降维:流形学习
15 | 从回归到分类:联系函数与降维
16 | 建模非正态分布:广义线性模型
17 | 几何角度看分类:支持向量机
18 | 从全局到局部:核技巧
19 | 非参数化的局部模型:K近邻
20 | 基于距离的学习:聚类与度量学习
21 | 基函数扩展:属性的非线性化
22 | 自适应的基函数:神经网络
23 | 层次化的神经网络:深度学习
24 | 深度编解码:表示学习
25 | 基于特征的区域划分:树模型
26 | 集成化处理:Boosting与Bagging
27 | 万能模型:梯度提升与随机森林
总结课 | 机器学习的模型体系
概率图模型 (14讲)
28 | 最简单的概率图:朴素贝叶斯
29 | 有向图模型:贝叶斯网络
30 | 无向图模型:马尔可夫随机场
31 | 建模连续分布:高斯网络
32 | 从有限到无限:高斯过程
33 | 序列化建模:隐马尔可夫模型
34 | 连续序列化模型:线性动态系统
35 | 精确推断:变量消除及其拓展
36 | 确定近似推断:变分贝叶斯
37 | 随机近似推断:MCMC
38 | 完备数据下的参数学习:有向图与无向图
39 | 隐变量下的参数学习:EM方法与混合模型
40 | 结构学习:基于约束与基于评分
总结课 | 贝叶斯学习的模型体系
结束语 (1讲)
结课 | 终有一天,你将为今天的付出骄傲
机器学习40讲
登录|注册

开篇词 | 打通修炼机器学习的任督二脉

王天一 2018-06-04
00:00
07:10
讲述:王天一 大小:3.30M
你好,我是王天一,我在“机器学习 40 讲”欢迎你的到来!
在上一季的专栏中,我与你一起走马观花地浏览了学习人工智能所需要的基础数学、当前流行的深度学习、以及其他可能实现智能的技术路径。广义的人工智能概念可以说包罗万象,其中每一个细分的子领域发展到今天都值得大书特书。40 篇文章的篇幅绘出的人工智能轮廓就像是一幅低分辨率的全景画,覆盖广度的同时必然难以兼顾深度。
正因如此,新一季的专栏内容将聚焦于人工智能大问题里的一个小目标——机器学习。在新进展层出不穷的今日,机器学习依然占据着人工智能的核心地位,迅猛的发展势头也让现在的机器学习领域充斥着各种听起来狂拽酷炫的新玩意儿。但阳光之下再无新事,再炫目的技术归根结底都是基本模型与方法在具体领域问题上的组合,而理解这些基本模型与方法才是掌握机器学习,也是掌握任何一门学问的要义所在
既然机器学习领域的文献论著已经汗牛充栋,这个专栏和它们的区别又在哪里呢?在我看来,是融会贯通的系统性。不少关于机器学习的文献虽然深入阐释了不同模型的原理,但对它们之间的关联却缺少清晰的解释,从而使内容的组织流于模型展览,仿佛一串没能串成项链的珍珠宝石。实际上,所有模型就像龙生九子一样,都是从基本模型出发,根据不同改进方法衍生出来。所以,这个专栏最重要的任务就是帮助你把握不同模型之间的内在关联,让你形成观察机器学习的宏观视角,找准进一步理解与创新的方向
在内容上,“机器学习”分为 3 个模块。
第一个模块是机器学习概观,介绍机器学习中超脱于具体模型和方法之上的一些共性问题,将从概率的两大派别开始。众所周知,概率在机器学习中扮演着核心角色,而频率学派与贝叶斯学派对概率迥异的认知也将机器学习一分为二,发展出两套完全不同的理论体系。正所谓兼听则明偏听则暗,理解机器学习时应该看到这同一枚硬币的两面,以获得完整的认知。除此之外,本模块还涵盖了计算学习等机器学习的理论问题,以及关于模型和特征的一些实验主题。
第二个模块将讨论频率学派发展出的机器学习理论——统计学习。统计机器学习的核心是数据,它既从数据中来,利用不同的模型去拟合数据背后的规律;也到数据中去,用拟合出的规律去推断和预测未知的结果。统计学习中最基础的模型是线性回归,几乎所有其他模型都是从不同角度对线性回归模型做出的扩展与修正。因此,在这个模块中,我将以线性模型为主线,和你一起浏览它的万千变化,观察从简单线性回归到复杂深度网络的发展历程。
第三个模块将讨论贝叶斯学派发展出的机器学习理论——符号学习,也就是概率图模型。和基于数据的统计学习相比,基于关系的图模型更多地代表了因果推理的发展方向。贝叶斯主义也需要计算待学习对象的概率分布,但它利用的不是海量的具体数据,而是变量之间的相关关系、每个变量的先验分布和大量复杂的积分技巧。在这个模块中,我将围绕概率图模型中的表示、推断、学习三大问题展开介绍,认识贝叶斯面纱下的机器学习。
除了理论之外,在介绍模型时我还会穿插一些基于 Python 语言的简单实例以加强理解。这些实例会应用诸如 Scikit-Learn 和 PyMC 等比较成熟的第三方库,通过调用现成的类来实现不同模型的功能。Python 语言的一大优势就是功能丰富又强大的第三方库,将它们束之高阁未免暴殄天物。在快速实现的基础上再进一步深入钻研核心代码,也是比较合理的学习路径。
理解机器学习绝不是简单地了解几个时髦概念,而是要将前沿和基础融会贯通,从中发现贯穿学科发展的脉络。这个专栏不是乾坤大挪移这种水平的内功心法,但如果能打通你修炼机器学习的任督二脉,它的价值就实现了。
我已做好准备,在接下来的三个多月里,和你分享我所理解的机器学习。也请你告诉我,你为什么要学习机器学习?你希望通过这个专栏得到哪些收获呢?
与君共勉!
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《机器学习40讲》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(48)

  • 风的轨迹
    高尚的说法:为了人类的进步
    得体的说法:为了事业与爱情
    庸俗的说法:为了屌丝逆袭

    作者回复: 已经答仨答案啦👍

    2018-06-06
    23
  • 梁CSer
    支持一下😁,王老师的人工智能基础讲的不错,多看几遍哈😄

    作者回复: 承蒙夸奖😄

    2018-06-04
    13
  • 林彦
    作为数据分析师,这个职业在未来大多数的国内企业里都必须和数据模型打交道,现在的数据模型和机器学习的关系越来越紧密,背后的概率论,统计学,贝叶斯推断是相通的。既为了自己的成长,也为了团队的进阶,挤一点时间多了解一些概念和实践,期望能与人沟通时小白水平的认知少一些,更高效一些。

    作者回复: 其实除了机器学习,还应该了解下数据挖掘

    2018-06-04
    6
  • 梁鑫辉
    最近单位在推AIOps(智能运维)的项目,主要
    关注机器学习在磁盘故障预测、性能容量预测方面的应用。想借此机会熟悉相关理论与实践,搭上人工智能的快车。感谢老师的课程,希望有所收获。

    作者回复: 第一次了解到这类应用,机器学习果然用途广泛啊

    2018-06-07
    4
  • 冬瓜
    老师在上面的留言说,除了机器学习,还要了解数据挖掘。但是在我们日常的生活中,我们通常不会区别这两个概念。也就是说,我们一会说自己是做数据挖掘的,一会说自己是做机器学习的。老师能说说这两者的区别吗?

    作者回复: 我觉得数据挖掘的目的是解释,说明已知数据的规律;机器学习的目的是预测,把已知数据的规律推广到未知。而且机器学习更侧重“学习”,要在训练过程中改善自身的性能,数据挖掘通常没有这种要求。

    2018-06-09
    3
  • 柳不才
    机器学习是深度学习的基础,没有机器学习领域的发展就没有今天深度学习的繁盛。在小数据,弱算力以及工业实现领域上,机器学习的优先级大于深度学习。学机器学习是为以后从事相关领域工作或研究打下基础。

    作者回复: 说的有道理

    2018-06-06
    3
  • 李跃爱学习
    公司希望能引入一些前沿的技术到我们的业务场景中, 成立了大数据部门。大数据部门换了几个leader了,现在让我来负责,做自己做了7年研发, 对公司的系统架构很熟悉,但是对机器学习等技能不了解。希望尽快补足这块的认知,搭建团队,识人用人。

    作者回复: 希望专栏能助您一臂之力!

    2018-12-15
    2
  • 顾合
    老师我是最近才报名的,课程更新已经结束了,希望老师后面看到后能够解答学生的疑惑。

    学生目前学习了一些基本的 Python 知识,感觉直接入手机器学习还是有难度的,当然最终目的还是想搞一些机器学习相关的东西。所以想请问老师,在掌握基础的 Python 知识与入门或者进阶的机器学习之间的鸿沟,中间我还需要掌握些什么?有什么可以推荐的学习路线吗??

    有些是推荐掌握 Python 知识后,可以从爬虫开始,到数据分析,再到数据挖掘,最后到机器学习,您觉得如何?

    作者回复: 我认为机器学习和Python是目的和手段的关系。机器学习是一套比较完善且成熟的理论,Python则是将这套理论实现在计算机上的工具。所以在两者之间要弥合的是从实践到理论,从感性到理性的沟壑。我的建议是有了编程基础之后,看一看数据分析,从数据分析的实例出发,通过实际的应用逐步过渡到数学原理的理解。极客上的相关专栏和一些以实例为主的书籍都可以作为参考。

    2018-11-16
    2
  • imuyang
    我参加这个专栏的目的就是:为以后工作中可能遇到的机器学习相关问题,做知识储备

    作者回复: 未雨绸缪是好习惯

    2018-06-06
    2
  • 不吐槽会死的喵星人
    为什么想学机器学习呢?很多原因,最基本的原因是想赚钱!现在机器学习吃香,想尝试转型。再一个,我坚信,不久的将来,人类绝大部分工作将被机器代替,我不想失业(即便可能高福利的失业)!最后的最后,我很期待机器觉醒的那一天,如果可以,我也想出一份力!!😁😁😁

    作者回复: 希望机器永不觉醒😄

    2018-06-04
    2
  • njzy_sbl51
    学习该门课程的目的:系统性掌握机器学习这门技术,愿能融会贯通,将其应用于生活领域,愿能取得一些突破性的进展。

    作者回复: 能够融入生活才是最高的境界

    2018-06-04
    2
  • Hurt
    一个pythoner 一直想开始学习 一直在开始的门口 那就从现在开始吧

    作者回复: 永远不会晚

    2018-06-04
    2
  • 路过蜻蜓
    为了赚钱

    作者回复: 实在人!

    2018-12-15
    1
  • liubin
    我的研究方向是机器视觉,想通过课程对机器学习有个基础的认识,然后结合机器视觉的知识做一些实际应用

    作者回复: CV与ML的结合推荐Simon JD Prince的computer vision,偏概率模型,风评不错

    2018-08-30
    1
  • paradox
    为了就业
    大三下学期来了开始自学
    看了老师您这门课所涉及的内容的图片
    发现自己85%名字都已有所了解
    但是问题就是自己总感觉有些模型很像,有些模型有联系,有些思想方法可以推广延伸,(比如从最大熵模型,涉及到熵,想到决策树,本身又是对数模型,想到逻辑回归与CRF,模型的参数估计过程的极大似然估计以及本身的P(Y|X)的形式又让我联想到贝叶斯的概率模型,其对偶求解过程又是SVM推导时候的主要方法)抱歉,这里叙述很乱,从模型分类联系到求解方法,夹杂自己的混乱想法
    总得来说,思想缺乏联系,无法在大脑形成网络
    看网课,统计学习方法,西瓜书,机器学习实战,自己也调包观察(不过太渣)
    每次每个模块感觉自己清楚了,但是完成下一模块后,上次的又有些模糊了,就是理解的不够深入。

    每次阅读您的上一门课,总会有所启发,尤其是开篇的那些数学课

    希望老师这门课能展现出整体的思想框架,加上实战指导指导对于实际问题如何下手
    知识书上可以学到,思想还需老师言传,自己思考

    作者回复: 线性模型是最基本的模型,决策树、逻辑回归、SVM这些都是不同方向的延伸和扩展。介绍完所有模型之后,我会专门把轮廓梳理出来。

    2018-06-08
    1
  • Einsame
    当然是感兴趣啦

    作者回复: 兴趣是最好的老师哦

    2018-06-07
    1
  • 清风浮云
    为自己的发展用尽全力,为了社会科技的发展、贡献自己绵薄之力。

    作者回复: 正能量👍

    2018-06-05
    1
  • Ronnyz
    虽然已经学了一段时间机器学习各模型知识了,还不能很好的融会贯通。希望打好基础,进阶到深度学习
    2019-12-08
  • 张振国
    不是为了职业不是为了酷炫,我学机器学习就是好奇,好奇它能干嘛?

    作者回复: 兴趣是最好的老师哦。可做的事情有很多,可以预测明天的股价,也能预测生男生女,前提是有足够的数据量。但预测的准确性就取决于很多因素了。

    2019-08-21
  • 张振国
    不是为了职业不是为了酷炫,我学机器学习就是好奇,好奇它能干嘛?
    2019-08-21
收起评论
48
93
返回
顶部