程序员的数学基础课
黄申
LinkedIn 资深数据科学家
83374 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 58 讲
导读 (1讲)
基础思想篇 (18讲)
程序员的数学基础课
15
15
1.0x
00:00/00:00
登录|注册

19 | 概率和统计:编程为什么需要概率和统计?

机器学习算法
大数据分析
机器学习
复杂度分析
统计值
数据分布
基尼指数
信息增益
信息熵
朴素贝叶斯分类算法
边缘概率
条件概率
联合概率
概率分布
随机变量
应用领域
统计学
信息论
贝叶斯定理
概率和统计的基本概念
概率统计知识

该思维导图由 AI 生成,仅供参考

你好,我是黄申。
通过第一个模块的学习,我想你对离散数学在编程领域中的应用,已经有了比较全面的认识。可以看出来,数据结构和基础算法体现的大多数都是离散数学的思想。这些思想更多的时候是给我们提供一种解决问题的思路,在具体指导我们解决问题的时候,我们还需要更多的数学知识。
比如说,在机器学习、数据挖掘等领域,概率统计就发挥着至关重要的作用。那关于概率统计,我们需要掌握哪些知识呢?这些知识究竟可以用在什么地方呢?第二模块的第一节,我们就来聊聊这些问题,让你对这一模块的学习做到心中有数。

概率和统计里有哪些需要掌握的概念?

在第一个模块中,我们认为所有事件都是一分为二的,要么必然发生,要么必然不发生。换句话说,事件的发生只有必然性,没有随机性。但是现实生活中,我们常常会碰到一些模棱两可的情况。
比如,你读到一则新闻,它报道了某个娱乐圈明星投资了一家互联网公司。那么,这则报道是属于娱乐新闻,还是科技新闻呢?你仔细读了读,觉得全篇大部分的内容都是讲述这家互联网企业的发展,而只有少部分的内容涉及了这位明星的私生活。你可能会说,这篇新闻 80% 的可能属于科技新闻,只有 20% 的可能属于娱乐新闻。
这里面的数字表示了事件发生的可能性。概率(Probability)就是描述这种可能性的一个数值。在概率的世界里,有很多概念。但是这几个非常基本的概念,你一定要知道。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

概率统计在编程领域扮演着重要角色,尤其对于机器学习、数据挖掘等领域至关重要。掌握概率统计的基本概念,如概率、随机变量、概率分布、联合概率、边缘概率、条件概率等,对于理解贝叶斯定理、朴素贝叶斯分类算法以及决策树算法等至关重要。此外,统计学在已知数据推导模型、关注数据分布和统计值方面也发挥着重要作用。概率统计的知识对于进行更精准的复杂度分析、机器学习和大数据分析等方面有着广泛应用。因此,对于读者快速了解概述提供了有益的信息。文章内容涉及了概率统计在编程领域的重要性以及相关基本概念,对读者快速了解提供了有益的信息。文章还提到了学习概率统计需要掌握的准备工作,以及概率统计在机器学习和大数据分析中的应用。整体而言,本文强调了概率统计在编程领域的重要性,以及其在机器学习和大数据分析中的广泛应用。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《程序员的数学基础课》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(28)

  • 最新
  • 精选
  • 唯她命
    对于离散型随机变量,通过联合概率 P(x, y) 在 y 上求和,就可以得到 P(x),这个 P(x) 就是边缘概率 看不懂啥意思啊,老师能举个剧透例子吗

    作者回复: 举个生活化的例子,100人里有10个人是学编程的,那么以这100人为全体样本,P(编程)=10/100=10%,而10个人中,3个人是前端编程的,7个人是学后端编程的,那么P(前端, 编程)=3/100=3%,P(后端, 编程)=7/100=7%,这两者加起来就是10%,也就是P(编程)。 简单的理解,如果把y所有出现情况的P(x, y)相加,就是P(x)了,联合概率变成了边缘概率。至于“边缘”这个名字的来源,你可以想象一下2维的联合概率分布,也就是一张表格,这个过程就是在二维的联合概率分布表格中,对一行或者一列加和,和就写在了表的边缘,这个概率就是“边缘”概率。

    2019-02-14
    74
  • 石维康
    在科技新闻中出现国际新闻的概率就是 5/20=25%。 请问这个是怎么算的?

    作者回复: 还是沿用了前面的100篇里有20篇是科技新闻

    2019-01-28
    2
    13
  • 李二木
    举个列:硬币只有正反两面,抛硬币正面朝上的概率为50%,假如我抛了三次,结果三次正面朝下。这就违背与直觉观察,这是最初理解概率比较困惑的地方。

    作者回复: 硬币正面朝上的概率为50%,这个是理论值,在实际中受到很多因素的影响。比如,这个硬币构造不够均匀,导致正面朝下的可能性更高。 另外,假设这三次抛的事件都是独立的,那么三次正面朝下的概率仍有50% * 50% * 50% = 12.5%。 所以从实验观测的角度来说,我们要抛足够多的次数,才可能获得更接近理论的值,否则偶然性太大。这些我会在后面的专栏介绍。

    2019-01-28
    11
  • Paul Shan
    概率论是选定模型,研究产生的数据有何特征。统计是根据数据反推模型参数。

    作者回复: 是的

    2019-08-29
    2
    8
  • 骑行的掌柜J
    因为学习数据分析实战的专栏 才发现之前对概率的理解太片面了 于是来补数学这一块 然后刚刚看完黄申老师这篇 发现其实下面三个专栏结合起来一起服用 会效果更好(程序员的数学基础课+数据分析实战45讲+数据结构和算法之美)比如第二个里面没有讲到的知识都基本可以在另外两个里面找到答案

    作者回复: 感谢对本专栏的肯定

    2019-12-03
    6
  • Paul Shan
    我学概率论,最大的困难在于正态分布的数学表达,现在分布函数已经全忘了,只记得大致的范围,分布在均值一个方差以内是68%,两个方差以内是94%,三个方差以内是99.67%。

    作者回复: 对于编程来说,有的时候可能不需要一下记住那么多细节,关键是概念清楚就好

    2019-08-29
    4
  • 罗耀龙@坐忘
    茶艺师学编程 曾经让我发怵的部分,现在,又来到了我的面前。 但听老师这么一讲,感觉比我当时学的简单多了。因为这里老师提到了一个在以前没有考虑的概念:复杂度分析。 在中学讲的概率,其实都包含这这么一个前提:所有情况出现的概率的一样的。 有这么一个经典题型,“在一个看不见的木箱里抽小球,有白色X个,有黑色Y个,请问抽10次,其中白球能出现多少次?” 假如每次抽球都不摇箱子,或者我的手短不能掏遍整个木箱,这样的话对于每一个小球,被抽中的机会就是不一样的。 现在就跟着老师游向更深的水域了······

    作者回复: 你能有所收获就是我们最大的满足

    2020-04-11
    1
  • Tom貓.[2012]🇷🇼
    概率论听了你的课感觉回到大学课堂了

    作者回复: 哈哈,希望比大学课堂更实用一些

    2020-04-07
    1
  • alic
    也就是某个事件受其他事件影响之后出现的概率,放到咱们的例子里。在国际新闻中出现科技新闻的概率就是 5/30=16.67%,在科技新闻中出现国际新闻的概率就是 5/20=25%。 这个后面25%是怎么得来的?

    作者回复: 还是沿用了前面的100篇里有20篇是科技新闻

    2019-01-28
    2
    1
  • 张号
    讲得很直白清晰,印象中上完那一学期概率论就会算题,应用场景不太清楚,转头就还回去了

    作者回复: 确实应用场景很重要,多学多用,就记得住

    2022-10-17归属地:美国
收起评论
显示
设置
留言
28
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部