数据分析思维课
郭炜
前易观 CTO
38045 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

05 | 直方图与幂分布:为什么全世界1%的人掌握着50%的财富?

重要性:每天多成功1%
规律:赢者通吃的世界
作用:找到数据规律
例子:企业竞争力
描述:20%的人占据80%的资源
例子:语言词汇使用率
描述:X轴开始的数值高(或低),以指数级下降(或上升)
例子:动物园平均参观人数
X轴:分类数据
用途:比较数据的大小
例子:动物园平均参观时长
X轴:定量数据或区域数据
用途:展示数据的分布
背后原因
符合帕累托法则或幂律分布的事情
帕累托法则
幂律分布
直方图
帕累托法则
幂律分布
柱状图
直方图
课后思考
小结
幂律分布与帕累托法则
直方图与柱状图
数据分析思维课

该思维导图由 AI 生成,仅供参考

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
我们之前讲了各种从数据结论中去伪存真的办法,我们今天更进一步,来看看当数据摆在你面前的时候,你应该如何从数据当中发现特征?
今天我就教给你一个最简单的办法——直方图。
你可能会有类似这样的想法:直方图还不简单,不就是柱状图吗?一个 Excel 就搞定了,我天天画柱状图。
但这种想法是错误的,因为直方图并不等于柱状图。现在请你花一分钟时间,仔细看看下面这两个图表,你能分辨出哪个是直方图,哪个是柱状图吗?
北京动物园日平均参观时长
北京动物园日场馆平均参观人数

直方图与柱状图

答案是第一个图(动物园平均参观时长)为直方图,第二个图(动物园平均参观人数)为柱状图。
看上去上面这两幅图都是用直直方方的图形来展示,但其实它们是两种完全不同的图形展现和数据分析方法。那问题来了,我们如何才能分清楚直方图和柱状图呢?
我教你一个最简单的办法:直方图是展示数据的分布,而柱状图是比较数据的大小。
更具体点来说,直方图的 X 轴是定量的数据或者区域数据(用于看分布),而柱状图 X 轴是分类的数据。就拿刚刚的这两个图来说,第一个图其实是 X 轴是人们观光动物园的时间分布,而第二个图的 X 轴是人们去动物园场馆的具体分类
直方图是针对定量数据分布的定性分析,柱状图是对分类数据的定量数据分析,这两兄弟长得很像,用途也是互为补充。在第一个图里你能看到有 40% 的游客是停留了 4 个小时,但无法知道每天有多少游客去动物园。而在第二个图里,你能够知道大概每天会有 95 万名游客去了熊猫馆,但不能够看到游客的游览时间分布情况。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

全球财富分配不均一直备受关注,数据分析是理解这一现象的关键。本文介绍了如何通过直方图和柱状图分析数据特征,展示了直方图在揭示全球新冠疫情发病人数分布和亚马逊雨林中树种分布的神奇之处。幂律分布形式在科学研究中被称为“幂律分布”,展现出指数下降或上升的分布形式。帕累托法则也被介绍,强调了重要的少数和琐碎的多数,呈现出“二八法则”的现象。文章还探讨了幂律分布在企业竞争力和个人发展中的应用,强调了积累优势的重要性。通过本文的介绍,读者可以了解到数据分析在揭示现实世界中复杂现象方面的重要性,以及直方图和幂律分布在数据分析中的应用和价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(44)

  • 最新
  • 精选
  • 大林 Kralite
    置顶
    新冠的那张图,应该是柱状图吧? 横轴是国家,不是数值分布。

    编辑回复: 是直方图。 直方图(Histogram)是一种可视化在连续间隔,或者是特定时间段或某区间内数据分布情况的图表,经常被用在统计学领域。 地域,也是一种区间或者连续间隔的标准。从使用上来看,直方图的目标是看数据分布,柱状图看的是平均值,排序具体数值。所以不能光看XY轴来判断。 比如,如果你把时间段统计出来放在X轴,人数放在Y周,但是如果你的图表要表现的是排序或者具体数值这些,XY轴看是直方图,但是整体图表现的依然是柱状图。所以,不能只看坐标轴。

    2021-09-01
    12
    11
  • 夜路破晓
    天之道,损有余而补不足;人之道,损不足而济有余。越是自然形成的越符合正态分布,越是人为制造的越符合幂律分布。法天相地,终究不可得。然此不可得,正是有所得。得失之道,名为人道,实乃天道。

    作者回复: 得数据之道!

    2021-08-10
    2
    92
  • trust
    能给领导留下好印象的其实是少量亮眼工作,多数工作内容领导都是不关心的。所以利用帕累托,我们应该把有限的精力放到有可能做出成果,有可能给自己带来优势的工作上

    作者回复: 其实,更高层面看,领导也只是小数据,还是要做长期对自己能力,见识,胸怀有利的事情

    2021-09-15
    2
    37
  • Scott少聪@SequoiaDB
    二八法则简单来说,就是 20% 的人占了 80% 的资源,剩下 80% 的人分最后 20% 的资源。 你比其他人更努力,每天多积累 1% 哪怕是 0.1% 的优势,这样把优势不断积累下去,你就会占据越来越多的资源,成为这个领域里面的专家。 以上两段要一起读,讲到二八法则时,往往让人很悲观,认为事情已成定数。但二八只代表现在,在同年龄同层次的人中,坚持做有效学习积累知识的20%,你将更有机会成为未来的「专家」。

    作者回复: 少聪说的对,哈哈哈

    2021-08-06
    16
  • mtfelix
    交作业:对孩子的正向反馈。

    作者回复: 的确,养娃也是积少成多的过程

    2021-08-09
    10
  • 钱鹏 Allen
    直方图发现分布的规律,幂律分布告诉我们头部的秘密,80%及以上资源。 每天进步一点点,与时间做朋友,让复利产生。

    作者回复: 是的!

    2021-08-17
    4
  • 智仔
    每天只要增加0.1% ,时间一长,也会有惊人的成长。找好象就是原子习惯法则哈

    作者回复: 哈哈,是的,所有的法则,算法背后哲理都是类似的

    2021-08-06
    4
  • 敏🌸
    小时候开学前会先把课文中的诗词背一遍,然后每天早上坚持早起,复习功课,所以成绩一直都还不错,这是不是就是正向积累,每天进步一点点。 上班后熬夜、晚期,上班迟到,慢慢的泯于众人是不是就是每天退步一点点。 呜呼哀哉,所以现在997秃头补课orz

    作者回复: 哈哈,社会才是最终的考场

    2021-11-07
    3
  • 王琬
    虽然二八原则非常重要,在竞争对手都争夺头部机会时,长尾理论也可能帮助我们发现别人忽略的机会。当边际成本非常低的时候,长尾加起来也是一个可观的数字。

    作者回复: 是的,所以,后面讲得推荐算法代表头条就颠覆了28原则下的官网。

    2021-10-20
    3
  • 进化菌
    优秀终究是少数,高处不胜寒。 帕累托法则,适用于大量领域。比如做技术的人,能力排前面的占比不高,但是技术创新的天平却大大的倾斜在这少数人里面~

    作者回复: 是的,所以他们占了80%的资源

    2021-08-06
    3
收起评论
显示
设置
留言
44
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部