02 数学基础 | 月有阴晴圆缺,此事古难全:概率论

2017-12-12 王天一
《人工智能基础课》
课程介绍


讲述:王天一

时长:大小5.12M


除了线性代数之外,概率论(probability theory)也是人工智能研究中必备的数学基础。随着连接主义学派的兴起,概率统计已经取代了数理逻辑,成为人工智能研究的主流工具。在数据爆炸式增长和计算力指数化增强的今天,概率论已经在机器学习中扮演了核心角色。
同线性代数一样,概率论也代表了一种看待世界的方式,其关注的焦点是无处不在的可能性。对随机事件发生的可能性进行规范的数学描述就是概率论的公理化过程。概率的公理化结构体现出的是对概率本质的一种认识。
将同一枚硬币抛掷 10 次,其正面朝上的次数既可能一次没有,也可能全部都是,换算成频率就分别对应着 0% 和 100%。频率本身显然会随机波动,但随着重复试验的次数不断增加,特定事件出现的频率值就会呈现出稳定性,逐渐趋近于某个常数。
从事件发生的频率认识概率的方法被称为“频率学派”(frequentist probability),频率学派口中的“概率”,其实是一个可独立重复的随机实验中单个结果出现频率的极限。因为稳定的频率是统计规律性的体现,因而通过大量的独立重复...

展开全文
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。

精选留言

  • 王天一
    置顶
    2017-12-13
    @Karl 一个优等生和一个差生打架,老师肯定认为是差生的错,因为差生爱惹事,这就是最大似然估计;可如果老师知道优生和差生之间原本就有过节(先验信息),把这个因素考虑进来,就不会简单地认为是差生挑衅,这就是最大后验估计。 两种方式分别对应不同的机器学习算法,具体应用在机器学习模块中分别有介绍。
    共 3 条评论
    215
  • 王天一
    置顶
    2017-12-12
    @yy 基础部分主要是引入概念,在后续的算法介绍中会涉及概念与方法的具体应用
    
    19
  • 漫漫越
    2019-03-14
    患病概率:(0.95*0.01)/(0.95*0.01+0.05*0.99)=16.1%

    作者回复: 完全正确!

    共 2 条评论
    14
  • 快乐松鼠蹦蹦跳
    2018-06-05
    @奋斗达人 这是一个贝叶斯定理应用的经典问题:有一种病在人群中的患病率是1%,其检查结果的可靠程度是95%,也就是得病的人95%会得到阳性结果,没得病的人95%会得到阴性结果。如果一个人检查的结果是阳性,那他得病的概率是多少? 用贝叶斯定理解决这个问题,得到的结果会出乎意料。 记得这样的题目,概率论学过,人工智能学过,但是总的都是模棱两可。现在学了这么多年,终于知道自己模糊的地方住在哪里了。套用贝叶斯公式求解,结果是0.1610

    作者回复: Bingo

    
    10
  • 小牛人
    2018-05-25
    得病的概率是16.1%

    作者回复: Bingo

    
    8
  • wolfog
    2018-01-13
    想问下天一老师,明天下雨的概率是85%那一段说贝叶斯学派认为概率是随机事件的可靠度。而频率学派则无法从频率的角度解释。我想问问频率学派无法解释的原因是下面的解释吗? 频率学派认为概率是随机事件在次数增多时频率的一个趋近值,而很显然明天下雨这个事件无法重复多次,所以频率学派的关于概率的定义明显就无法再这里定义。 感谢天一老师

    作者回复: 没错,这是一锤子买卖的事情

    共 2 条评论
    8
  • 听天由己
    2017-12-27
    概率论从直觉上比线性代数容易理解,可还是要花时间去琢磨。 思考题我有几个想法: 1、产品中最常见的就是电商系统的推荐,亚马逊在一方面很早就开始实践,根据你已经买过的东西的信息来判断购买其他商品的可能性; 2、垃圾邮件过滤器,给定一封邮件,它是垃圾邮件的可能性是多大。机器甄别可能用处更大 3、第三就是拼写纠错与语义分词。 这几个方面是我结合实践生活和学习想到的,要真正将问题转化成模型与数学语言真的好难。

    作者回复: 没错,最常见的例子就是文本分类。建模确实难度很大,而且没有通用的规则,使用哪些工具需要具体情况具体分析。

    
    7
  • Rola
    2018-07-22
    英语专业的看不懂,怎么办

    作者回复: 刚刚接触确实需要循序渐进,阅读专栏时可以考虑结合科班的教材。

    
    3
  • 凡拾
    2018-03-22
    思考题的理解—根据欺诈的结果推算哪种因素符合会最大概率出现欺诈,这算不算贝叶斯?2.在估计参数时,最大似然估计法只需要使用训练数据,最大后验概率法除了数据外还需要额外的信息,就是贝叶斯公式中的先验概率。为什么要额外信息不理解

    作者回复: 因为最大似然假定待估计的参数是固定的,估计的准确与否取决于数据;最大后验则认为参数也是随机变量,有自己的先验分布。这就是额外的信息,因为数据本身体现不出参数的先验特性。

    
    3
  • 凌波微步
    2018-10-25
    感觉在学校学的课程太渣了,枯燥的介绍公式,学完不知道怎么用,知识没有串起来。学了王老师这一课,受益匪浅,感觉学得很爽。后面的课程要坚持学下去!

    作者回复: 学校的课程也是很充实的,只是设计上有些问题。

    
    2