程序员的数学基础课
黄申
LinkedIn 资深数据科学家
83374 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 58 讲
导读 (1讲)
基础思想篇 (18讲)
程序员的数学基础课
15
15
1.0x
00:00/00:00
登录|注册

21 | 概率基础(下):联合概率、条件概率和贝叶斯法则,这些概率公式究竟能做什么?

随机变量之间的独立性
贝叶斯定理
联合概率、条件概率和边缘概率
概率公式

该思维导图由 AI 生成,仅供参考

你好,我是黄申。
上一节我介绍了随机现象、随机变量以及概率分布这些比较简单的概念。为什么要学习这些概念呢?其实就是为了更精确地描述我们生活中的现象,用数学的视角看世界,以此解决其中的问题。
但是实际生活中的现象并非都像“投硬币”那样简单,有很多影响因素都会影响我们去描述这些现象。比如,看似很简单的“投硬币”,我们其实只是考虑最主要的情况,粗暴地把硬币出现的情况一分为二。比如说,不同类型的硬币是否会影响正反面的概率分布呢?站立的情况如何考虑呢?再比如说,在汽车速度的例子中,经过的交通路线,不同的路线是否会影响速度的概率分布呢?
一旦影响因素变多了,我们需要考虑的问题就多了。想要解决刚才那几个问题,更精确地描述这些现象,我们就需要理解几个新的概念,联合概率、条件概率以及贝叶斯法则。
从数学的角度来说,这些概念能描述现实世界中更为复杂的现象,建立更精细的数学模型。比如,我们后面要讲的朴素贝叶斯算法就是建立在联合概率、条件概率和边缘概率之上的。所以,这一节的内容也非常重要,你一定要认真学习并且掌握。

联合概率、条件概率和边缘概率

最近,我一直在操心儿子的教育问题,所以一直在研究他班级的成绩单。为了弄清我儿子在班级上的成绩排名,我向老师要了张全班成绩的分布表。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入探讨了联合概率、条件概率和贝叶斯法则在现实生活中的应用。通过班级成绩分布的案例,作者生动地解释了这些概念,并强调了它们在实际问题中的重要性。文章还涉及了随机变量之间的独立性,以及独立性对简化计算的重要作用。贝叶斯定理的定义和其在机器学习中的应用也得到了详细阐述。最后,作者提出了一个思考题,引发读者思考和讨论。整体而言,本文内容丰富,涵盖了概率和统计学知识,适合对这些领域感兴趣的读者阅读。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《程序员的数学基础课》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(52)

  • 最新
  • 精选
  • qinggeouye
    随机变量 X 的取值:爷爷、奶奶,随机变量 Y 的取值:50 、100。 问题:求解 P(X=爷爷|Y=100) 、P(X=奶奶|Y=100) 。 由统计数据可知: P(Y=100) = (6 + 4) / (4 + 6 + 8 + 4) = 5/11 P(X=爷爷, Y=100) = 6 / (4 + 6 + 8 + 4) = 3/11 P(X=奶奶, Y=100) = 4 / (4 + 6 + 8 + 4) = 2/11 则: P(X=爷爷|Y=100) = P(X=爷爷, Y=100) / P(Y=100) = 3/5 P(X=奶奶|Y=100) = P(X=奶奶, Y=100) / P(Y=100) = 2/5

    作者回复: 写得很清楚

    2019-03-03
    46
  • Joe
    新年好,简单公式推导如下,虽然可以直接看出来。 设事件x:抽中100元红包; 事件y:抽到爷爷的红包。 则100元的红包来自爷爷的概率:P(y|x) = P (x,y) / P(x) = (6/22) / (10/22) = 0.6 100元红包来自奶奶的概率为:0.4

    作者回复: 是的

    2019-02-01
    28
  • 动摇的小指南针
    我理解贝叶斯的应用场景,就是充分利用统计和先验,转化为预测

    作者回复: 是的👍

    2019-04-18
    13
  • strentchRise
    P(爷爷|100) * P(100) = P(100|爷爷) * P(爷爷) P(爷爷|100) = P(100|爷爷) * P(爷爷) / P(100) P(爷爷|100) = (6/10) * (10/22) / (10/22) P(爷爷|100) = 6/10 = 0.6 P(奶奶|100) = 1 - P(奶奶|100) = 1 - 0.6 = 0.4

    作者回复: 正解👍

    2019-02-02
    5
  • Mr_杨
    独立性是不是不够严谨,不能只通过相等就判断是独立事件,应该是看同条件下不同结果对事件的概率影响,没有影响就是独立的,比如P(y|x)=P(y|-x),我这个理解对吗?

    作者回复: 是的,相等只是必要但不充分条件

    2019-07-22
    4
  • 小伟
    对概率有个很大的疑惑,40%和50%,区别有多大?老师可以帮助解答下吗?

    作者回复: 这是个好问题,很多时候人类只对极端值更有清晰的感知,比如10%和90%。但是对于中间值,例如40%和50%到底有多大区别?可能很难从直观上体会到,这里的数值的差别更多的是让计算机进行决策

    2019-08-31
    3
  • 永旭
    老师, 你好. P(男生 | 90-100) 和 P(90-100 | 男生) 有什么区别 ? 怎么理解呢 ?

    作者回复: P(男生|90-100)是表示90-100分里有多少个男生,比如全班90-100分有10个人,其中男生4人,那么这个概率就是40% 而P(90-100|男生)是表示男生里有多少个人是90-100分,比如全班男生有40个人,其中90-100的4人,那么这个概率就是10%

    2019-02-14
    2
    3
  • 无法言喻.
    0.6,0.4吧,直接看出来的,不知道对不。公式还不习惯,需要好好消化一下。

    作者回复: 结果是对的,可以用贝叶斯定理推导一下

    2019-02-01
    3
  • teddytyy
    边缘概率不就是单个随机变量的概率吗?

    作者回复: 确切的说,是某个随机变量,在不同取值(情况)下的概率和

    2019-12-17
    2
  • 罗耀龙@坐忘
    茶艺师学编程 交作业 设定拿到一封100元利是是来自爷爷,其事件概率为P(爷爷|100);是来自奶奶的,为P(奶奶|100);拿到一封利是,是来自爷爷的,P(爷爷);拿到来吃奶奶的利是,P(奶奶);拿到一封100元利是,P(100)。 那么 P(爷爷|100)=[P(100|爷爷)×P(爷爷)]/P(100)=[(6/10)×(10/22)]/(10/22)=0.6=60% P(奶奶|100)=[P(100|奶奶)×P(奶奶)]/P(100)=[(4/12)×(12/22)]/(10/22)=0.4=40% 拿到一封100元的利是,有60%的概率是来自爷爷,有40%的概率是来自奶奶。 另一种解法: 在算出爷爷的概率是60%后,我们可以考察到,在100元利是上,不是来自爷爷就是来自奶奶(就他们俩在发利是),可以将这视为互斥事件,那么是来自奶奶的概率就是1-0.6=0.4=40%。

    作者回复: 是的

    2020-04-13
    1
收起评论
显示
设置
留言
52
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部