人工智能基础课
王天一
工学博士,副教授
立即订阅
11752 人已学习
课程目录
已完结 58 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词 | 人工智能:新时代的必修课
免费
数学基础 (7讲)
01 数学基础 | 九层之台,起于累土:线性代数
02 数学基础 | 月有阴晴圆缺,此事古难全:概率论
03 数学基础 | 窥一斑而知全豹:数理统计
04 数学基础 | 不畏浮云遮望眼:最优化方法
05 数学基础 | 万物皆数,信息亦然:信息论
06 数学基础 | 明日黄花迹难寻:形式逻辑
(课外辅导)数学基础 | 拓展阅读参考书
机器学习 (10讲)
07 机器学习 | 数山有路,学海无涯:机器学习概论
08 机器学习 | 简约而不简单:线性回归
09 机器学习 | 大道至简:朴素贝叶斯方法
10 机器学习 | 衍化至繁:逻辑回归
11 机器学习 | 步步为营,有章可循:决策树
12 机器学习 | 穷则变,变则通:支持向量机
13 机器学习 | 三个臭皮匠,赛过诸葛亮:集成学习
14 机器学习 | 物以类聚,人以群分:聚类分析
15 机器学习 | 好钢用在刀刃上:降维学习
(课外辅导)机器学习 | 拓展阅读参考书
人工神经网络 (7讲)
16 人工神经网络 | 道法自然,久藏玄冥:神经网络的生理学背景
17 人工神经网络 | 一个青年才俊的意外死亡:神经元与感知器
18 人工神经网络 | 左手信号,右手误差:多层感知器
19 人工神经网络 | 各人自扫门前雪:径向基函数神经网络
20 人工神经网络 | 看不见的手:自组织特征映射
21 人工神经网络 | 水无至清,人莫至察:模糊神经网络
(课外辅导)人工神经网络 | 拓展阅读参考书
深度学习 (7讲)
22 深度学习 | 空山鸣响,静水流深:深度学习概述
23 深度学习 | 前方有路,未来可期:深度前馈网络
24 深度学习 | 小树不修不直溜:深度学习中的正则化
25 深度学习 | 玉不琢不成器:深度学习中的优化
26 深度学习 | 空竹里的秘密:自编码器
27 深度学习 | 困知勉行者勇:深度强化学习
(课外辅导)深度学习 | 拓展阅读参考书
深度学习框架下的神经网络 (5讲)
28 深度学习框架下的神经网络 | 枯木逢春:深度信念网络
29 深度学习框架下的神经网络 | 见微知著:卷积神经网络
30 深度学习框架下的神经网络 | 昨日重现:循环神经网络
31 深度学习框架下的神经网络 | 左右互搏:生成式对抗网络
32 深度学习框架下的神经网络 | 三重门:长短期记忆网络
深度学习之外的人工智能 (4讲)
33 深度学习之外的人工智能 | 一图胜千言:概率图模型
34 深度学习之外的人工智能 | 乌合之众的逆袭:集群智能
35 深度学习之外的人工智能 | 授人以鱼不如授人以渔:迁移学习
36 深度学习之外的人工智能 | 滴水藏海:知识图谱
应用场景 (4讲)
37 应用场景 | 你是我的眼:计算机视觉
38 应用场景 | 嘿, Siri:语音处理
39 应用场景 | 心有灵犀一点通:对话系统
40 应用场景 | 数字巴别塔:机器翻译
加餐 (5讲)
课外谈 | “人工智能基础课”之二三闲话
推荐阅读 | 我与人工智能的故事
直播回顾 | 机器学习必备的数学基础
第2季回归 | 这次我们来聊聊机器学习
新书 | 《裂变:秒懂人工智能的基础课》
复习课 (7讲)
一键到达 | 数学基础复习课
一键到达 | 机器学习复习课
一键到达 | 人工神经网络复习课
一键到达 | 深度学习复习课
一键到达 | 深度学习框架下的神经网络复习课
一键到达 | 深度学习之外的人工智能复习课
一键到达 | 应用场景复习课
结束语 (1讲)
结课 | 溯洄从之,道阻且长
人工智能基础课
登录|注册

03 数学基础 | 窥一斑而知全豹:数理统计

王天一 2017-12-14

在人工智能的研究中,数理统计同样不可或缺。基础的统计理论有助于对机器学习的算法和数据挖掘的结果做出解释,只有做出合理的解读,数据的价值才能够体现。数理统计(mathematical statistics)根据观察或实验得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断

虽然数理统计以概率论为理论基础,但两者之间存在方法上的本质区别。概率论作用的前提是随机变量的分布已知,根据已知的分布来分析随机变量的特征与规律;数理统计的研究对象则是未知分布的随机变量,研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断。

用一句不严谨但直观的话讲:数理统计可以看成是逆向的概率论。用买彩票打个比方,概率论解决的是根据已知的摇奖规律判断一注号码中奖的可能性,数理统计解决的则是根据之前多次中奖 / 不中奖的号码记录以一定的精确性推测摇奖的规律,虽然这种尝试往往无功而返。

在数理统计中,可用的资源是有限的数据集合,这个有限数据集被称为样本(sample)。相应地,观察对象所有的可能取值被称为总体(population)。数理统计的任务就是根据样本推断总体的数字特征。样本通常由对总体进行多次独立的重复观测而得到,这保证了不同的样本值之间相互独立,并且都与总体具有相同的分布。

在统计推断中,应用的往往不是样本本身,而是被称为统计量的样本的函数。统计量本身是一个随机变量,是用来进行统计推断的工具。样本均值和样本方差是两个最重要的统计量

  • 样本均值:X¯=1ni=1nXi
  • 样本方差:S2=1n1i=1n(XiX¯)2

统计推断的基本问题可以分为两大类:参数估计(estimation theory)和假设检验(hypothesis test)

参数估计

参数估计是通过随机抽取的样本来估计总体分布的方法,又可以进一步划分为点估计(point estimation)和区间估计(interval estimation)。在已知总体分布函数形式,但未知其一个或者多个参数时,借助于总体的一个样本来估计未知参数的取值就是参数的点估计。点估计的核心在于构造合适的统计量 θ^,并用这个统计量的观察值作为未知参数 θ 的近似值。点估计的具体方法包括矩估计法(method of moments)和最大似然估计法(maximum likelihood estimation)。

© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《人工智能基础课》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(18)

  • MJ小朋友
    对我们大二学的概率论与数理统计这本书的总结
    2017-12-18
    10
  • 小太白dingyi david
    有点疑惑,数理统计 和 贝叶斯方法中的后验概率计算 之间有何区别和联系? 谢谢!

    作者回复: 思路是类似的,但数理统计是从有限的数据出发进行推测,因此除了给出待估计的参数的取值之外,还要计算出取值的可信程度,就像一个从不把话说死的人。

    2018-02-07
    4
  • 刘祯
    继续补课中,数理统计更要花功夫了。我想了想,今天的思考题答案如下:

    两者的相同点在于,它们都是着眼于从数据中学习,探讨如何从数据中提取人们需要的信息或规律,如何辅助人类决策或者分析。

    两者的不同点在于,它们分析的方式可能不尽相同,机器学习强调最终的精确程度,也就是老师所说的性能优化,而且并不需要对有关变量之间的潜在关系提出先验假设,只是需要更多维度的数据来增加分析,数理统计中关心推导方式,还要了解估量值和数据特征,那三个标准就是我们研究所必须了解的内容,否则会容易造成偏差。
    2017-12-28
    3
  • yunfeng
    【数理统计与AI】数理统计是理论基础,AI是其一个应用场景,数理统计此基础科学的发展,也会促进AI的发展,反之亦然。
    2018-01-16
    2
  • 多动脑少废话
    这篇文章可以当成数理统计的大纲,深入学习还是要看数理统计的教材
    2017-12-24
    2
  • Hanan
    模型的偏差越大就越欠拟合,也就是训练误差越大;方差越大就是越过拟合,也就是测试误差越大。请问可以这样理解吗?
    2019-07-13
  • Geek_jianghao
    为什么学习器不是通过对训练数据学习到具有普适性的模型呢?
    2019-06-22
  • 胖胖胖
    研一快结束了,修完了矩阵论,数理统计,最优化和数值分析,重新来听了一遍,感觉讲了很不错,讲的很精炼,但感觉对真正完全的初学者不是很友好。。。比如上学期刚开学的我。。。
    2019-05-21
  • 进击的mosquito
    数理统计是机器学习中使用方法之一,是机器学习的工具。
    2019-04-05
  • 卡卡
    数理统计大纲,第三讲,打卡!
    2018-12-14
  • Bellaxy
    全是干货。细节还要自己去看。
    2018-11-07
  • forrest
    感觉数学都忘完了😱
    2018-06-03
  • 凡拾
    比较赞同“我觉得数理统计更偏向于从理论角度研究方法论,进而探讨如何应用。而机器学习是基于一类场景,从解决问题的角度出发来寻找适合的方法,是数理统计在具体应用层面的一个分支”
    2018-03-22
  • 吴文敏
    范化误差的三部分中,我知道偏差和方差是和模型相关的,我们可以通过调整假设改变模型进而trade-off两者。噪音是和模型无关的吗?也就是说噪音表示当前学习任务的理论瓶颈?

    作者回复: 关于噪声可以这么理解,因为再好的模型也不会降低问题的难度。梯子可以让你爬得更好,却没法把墙变矮。

    2018-01-09
  • hockidoggy
    我觉得数理统计更偏向于从理论角度研究方法论,进而探讨如何应用。而机器学习是基于一类场景,从解决问题的角度出发来寻找适合的方法,是数理统计在具体应用层面的一个分支。

    作者回复: 可以这么理解,机器学习的各种算法是数理统计思想的载体。

    2017-12-28
  • 是不是要先学微积分和线性代数,然后学概率论和数理统计,最后再学统计学,才算有了初步的基础。
    2017-12-27
  • 秦龙君
    学习了。
    2017-12-16
  • 一念
    开了眼界,棒。
    2017-12-15
收起评论
18
返回
顶部