数据分析思维课
郭炜
前易观 CTO
38045 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

08 | 标准差:这人是不是“靠谱”其实看标准差?

附录
课后思考
小结
标准误差
标准差
怎样能快速看清一组数据的大概情况?
数据分析思维课

该思维导图由 AI 生成,仅供参考

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
前面我们讲过平均值不能够代表整体的水平,也给你讲了大数定律、散点图这些知识。接下来我们再进入一个常见的问题:怎样能快速看清一组数据的大概情况?
对于这个问题来说,我们不必用非常复杂的散点图或者文字来进行表述,这个时候就轮到标准差登场了。标准差和数据分布、平均值一起就可以很方便地描述一组数据的大致情况。
标准差还有一个孪生兄弟叫做标准误差,这两个兄弟确实很像,我们也会经常能听到说“这个问题在误差允许的范围里。”感觉一旦说了这句话,好像这个东西就很靠谱了,但真的这样吗?今天我就给你展开讲讲标准差和标准误差。

标准差

标准差的概念比较简单,它代表一组数值和平均值相比分散开来的程度。也就是说,标准差大代表大部分的数值和平均值差异比较大,标准差小代表这组数字比较接近平均值。
标准差的计算公式我给你放在了附录里,公式看上去稍微复杂一点,但主要就是算每一个数据和平均值之间的差异距离。你经常听说某市平均薪资是 X 万,你很纳闷我和周边人薪资这么少,为啥平均薪资那么高,我是怎么“被涨薪”的?我们可以看一下下面这个例子,假如两个小组的月薪大概是如下这个样子,单位都是“万”。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

标准差和标准误差是统计学中重要的概念,用于衡量数据的分散程度和推断统计结果的可靠性。标准差描述了一次统计中个体之间的离散程度,而标准误差则反映了多次抽样中样本均值对总体均值的代表性。本文深入浅出地介绍了这两个概念的区别和具体应用,包括在产品质量控制、正态分布和稳定性评估中的运用。通过生动的例子和图表,读者可以更好地理解标准误差在实际生活和工作中的重要性,以及如何利用标准差和标准误差来评估数据的分布情况和推断统计结果的可靠性。文章还提出了课后思考问题,鼓励读者分享自己的经验和观点,促进共同学习。整体而言,本文内容通俗易懂,对读者具有很高的实用价值,适合对统计学感兴趣的读者阅读学习。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(16)

  • 最新
  • 精选
  • 201201904
    “4 个标准误差的美女约为 43 年一遇;……”这种说法是不是缺了一个条件,这就是每天随机遇见的人数。假设人的颜值分布不变,一个宅男和车站安检人员每天见到4个标准差的美女的概率肯定差很大呀。

    作者回复: 哈哈哈,是的,米更严谨,这里我做了一个比喻,并不严格

    2021-09-13
    9
  • Shark
    标准误差(Standard error)= 多次抽样中样本均值间的离散程度,反映了样本均值对总体均值的代表性,用于推论统计。 对样本的数量有要求吗?

    作者回复: 有的,这个可以根据正态分布或者数据分布来进行统计,你可以参考第6节课里推算样本数量的部分,我也加入到这个课程里参考里面。

    2021-08-13
    1
  • Geek_11beeb
    老师,我想问假如现在有个正态曲线得到一个离散系数,随后将该正态曲线向右平移一个∑的位置,这样离散系数会变小,但是实际上这样个图西格玛是一样可以理解为离散程度一样吗

    作者回复: 有点没太理解你的问题,具体场景是什么?

    2021-11-21
  • 那时刻
    请问老师,我们开发的代码的质量控制是 6-sigma,这个要怎么计算或者推断呢? 代码开发完成之后,进行单元测试,接口测试,然后QA测试完成之后,发布到线上。线上发布三个月出了两次问题,算个比例么?

    作者回复: 好问题,这是一个管理问题,不同阶段考核不同,编程质量一般看单元测试和内部QA测试,整体产品质量看上线问题,因为上线后问题不仅仅是研发问题,产品设计,环境问题都算

    2021-08-13
    2
  • SVV
    想到一本经典书,《行为科学统计精要》,大家感兴趣也可以看一看。
    2021-09-10
    20
  • 80分
    将标准差和标准误联系起来理解:标准误是不同样本的统计量的标准差。学习过程中发现了这篇帖子https://www.zhihu.com/question/22864111,有助于从多角度理解这两个概念。
    2021-09-17
    11
  • 不再是入门水平python的小宇
    我想起来我最近找工作的经历,因为以前太菜了,跳槽比较频繁,对应到一个人的稳定性,我就是标准差很大哈哈哈哈
    2021-11-23
    4
  • Haoz
    靠谱是一个在职场以及生活中都非常重要的一个特性,标准差给我们提供了一个可以从数字上计算靠谱程度的角度,挺有意思的。严于律己,宽以待人,是我一向的原则,希望能够继续坚持下去。
    2021-10-23
    3
  • 进化菌
    标准差让我想起了一个词,叫“长期主义”,大部分时间变化不大的情况下长期做一件事情。
    2021-08-13
    2
  • 数据分析星球
    标准差是衡量波动性/稳定性的,结合着平均值可以产生不依赖量纲的离散系数。标准误差让我想起了中心极限定律,用样本估计总体,才有了一个标准差,2个标准差、6个标准差(6sigma)对应的"可信区间"。
    2022-08-08归属地:安徽
    1
收起评论
显示
设置
留言
16
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部