性能工程高手课
庄振运
Facebook 性能优化和容量管理高级专家
24631 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
性能工程高手课
15
15
1.0x
00:00/00:00
登录|注册

05 | 概率统计和排队论:做性能工作必须懂的数理基础

排队的模型
排队系统的输出参数
排队系统的输入参数
排队论
正态分布
二项分布
泊松分布
方差/标准差
百分位数
四分位数
中位数
平均值
描述性统计分析
置信区间
贝叶斯定理
概率
思考题
总结
排队的理论
重要的分布模型
数理统计的点估计指标
概率和置信区间
性能工作必须懂的概率统计和排队论数理基础

该思维导图由 AI 生成,仅供参考

你好,我是庄振运。
上一讲我们讲了和性能优化有关的三大基础定律法则。今天我们继续打基础,讲一点统计方面的数理知识,包括重要的概率统计排队论
或许你对概率统计和排队论有点发怵,但这些内容是必须学会的,因为它们很重要。因为它们是性能测试和优化这座高楼大厦的地基。地基打不好,性能测试和优化也不会做得很好。
而且我想强调的是:你完全没有必要惧怕,因为你只需要学习一部分最基础的知识,这些知识对多数人和多数场合大体就够了。还记得上一讲的帕累托法则吗?根据帕累托法则,这一讲的内容或许占不到平时教科书内容的 20%,但却可以覆盖 80% 以上的应用场合。

概率和置信区间

今天的内容我们先从概率和置信区间讲起。
概率(Probability),也称几率和机率,是一个在 0 到 1 之间的实数,是对随机事件发生之可能性的度量。这个你应该都懂,不需要我多说。
但概率论中有一个很重要的定理,叫贝叶斯定理,我们做性能测试和分析中经常需要用到,所以我们稍微讲讲。
贝叶斯定理(Bayes’ theorem)描述的是在已知一些条件下,某事件的发生概率。比如,如果已知某癌症与寿命有关,合理运用贝叶斯定理就可以通过得知某人年龄,来更加准确地计算出他患上该癌症的概率。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文介绍了在进行性能工作时必须了解的概率统计和排队论的数理基础。作者首先强调了这些知识的重要性,并鼓励读者学习基础知识,因为它们是性能测试和优化的基础。文章首先讲解了概率和置信区间的概念,以及贝叶斯定理的应用。接着介绍了数理统计的点估计指标,包括平均值、中位数、四分位数、百分位数以及方差/标准差等。这些指标可以帮助分析和理解大量数据,对性能测试和优化过程至关重要。此外,文章还介绍了泊松分布、二项式分布和正态分布等重要的分布模型,以及排队论在性能工程中的重要性。排队论能够帮助正确设计和有效运行各个服务系统,使之发挥最佳效益。最后,文章提出了一些思考题,引发读者对自身系统中性能指标要求的思考。整体而言,本文通过介绍概率统计和排队论的数理基础,为读者提供了在性能工作中必备的技术知识和工具。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《性能工程高手课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(14)

  • 最新
  • 精选
  • 乘坐Tornado的线程魔法师
    请教下,二项分布时,中位数的表达会受很大的负面影响。原因是?

    作者回复: 哦,二项分布比较特殊,没有一个单一的公式可以求出中位数,甚至中位数有可能是不唯一的。

    2019-12-08
    4
  • Jxin
    1.全篇看着眼熟,看完还是停留在眼熟。概率论早忘光了。 2.今天这篇不好记忆,纯理论定义本身是比较枯燥的,在这么小的篇幅里更像是过眼云烟。我们因为价值而去学习,并不会因为难而不学。但如何易学还是要讲究下的,最直观的莫过于show me the code。所以将对应概率理论结合具体应用场景来讲,相辅相成,应该能更好吸收些。 3.感谢老师的分享。

    作者回复: 理解,就这篇比较难点,保证后面很少这样的数学。:)

    2019-12-06
    1
  • spp
    老师您好,请问关于排队论有没有好的书籍或者教材推荐?

    作者回复: 如果想深入学习的话,很多大学教材写得非常好。 如果只是想快速上手的话,网上搜搜就够了,比如wikipedia.

    2020-03-10
  • xiaobang
    排队论有什么重要的结论在性能优化中用的比较多的?老师能举例介绍下吗

    作者回复: 有很多地方会使用排队论的知识的,尤其是需要具体Quantify一些指标的时候。比如模块或者服务器都会处理各种请求,那么几个变量之间的关系可以用排队论来建模:请求速度,服务器数量(服务能力),服务延迟。

    2020-01-06
  • 张祺
    请问老师文章中二项分布,泊松分布,根据公式输入的值,自动画出图形的是什么工具呀?

    作者回复: 不是工具,有些网站可以在线做的。你Google搜一下。

    2019-12-08
    3
  • glutton
    之前只是知道tp99这种分位值比算数平均值更有参考价值,但是完全不知道跟概率论的关系,看到了理论依据,底气更足了,哈哈 排队论这里,结合日常场景的话,线程池、连接池都是典型的应用场景,线程池大小、等待队列长度、等待超时时常这些值都影响着性能,这样理解对吧?

    作者回复: 对的。

    2019-12-08
  • Q
    懵逼了~~ 数学一直是短板。。。 求老师介绍些概率统计学方面的书籍研读补习下。。

    作者回复: 这个领域中文的书我也不了解情况,你可以试试搜索一下(比如网上书店),看看评价。尽量找简单易懂的看,因为咱们不是为了研究那些领域,就是应用。

    2019-12-06
    2
  • 黑崽
    概率论学完十几年了,只对正态分布有些印象,其他不记得了。看了文章说的也似懂非懂,老师是否会在后面的课程中,结合具体实践讲一讲?

    作者回复: 概率论这门课是比较难;基本的知识有时候会在工作中用到得。不过只要你学过,捡起来很容易的。 具体工作中,面对很多变量的根因分析时,一般会用到。还有就是做预测时候,因为有不确定性,所以置信区间这些概念要懂,比如90% vs. 50% confidence。

    2019-12-06
    2
  • 许童童
    老师讲得真好,懂了理论,我们做起性能分析才能有理可依,不然就像盲人摸象,给你测试出来的数据,你也不知道如何去分析,从而解决性能问题。
    2019-12-06
    3
  • 皮特尔
    GET: 通过这些数学方法,可以明确定义、计算系统的性能指标,为下一步性能优化指明方向。
    2020-05-31
    1
收起评论
显示
设置
留言
14
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部