数据分析思维课
郭炜
前易观CTO
新⼈⾸单¥59
2575 人已学习
课程目录
已更新 25 讲 / 共 33 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (2讲)
开篇词 | 数据给你一双看透本质的眼睛
免费
导读 | 万物背后的规律都是数据
数据分析基础 (11讲)
01 | 平均值:不要被骗了,它不能代表整体水平
02 | 大数定律与小数陷阱:生活是随机还是有定数的?
03 | 数据的期望值:为什么你坐的飞机总是晚点?
04 | 随机对照试验:章鱼保罗真的是“预言帝”么?
05 | 直方图与幂分布:为什么全世界1%的人掌握着50%的财富?
06 | 数据分布:房子应该是买贵的还是买便宜的?
07 | 散点图和相关性:怎样快速从数据当中找到规律?
08 | 标准差:这人是不是“靠谱”其实看标准差?
09 | 数据抽样:大数据来了还需要抽样么?
10 | 指数和KPI:智商是怎么计算出来的?
11 | 因果倒置:星座真的可以判定你的性格吗?
数据算法基础 (9讲)
12 | 精确率与置信区间:两种预测,你究竟应该相信哪一个?
13 | 趋势分析与回归:父母高,孩子一定高么?
14 | 初识聚类算法:物以类聚,让复杂事物简单化
15 | 初识分类算法:分而治之,不断进化
16 | 关联规则:为什么啤酒和尿布一起卖?
17 | 蒙特卡洛与拉斯维加斯:有限时间内如何获得最优解?
18 | 马尔可夫链:你的未来,只取决于你当下做什么
19 | 协同过滤:你看到的短视频都是集体智慧的结晶
20 | 人工智能初探:阿尔法狗是怎样的一只“狗”?
如何用数据说话 (2讲)
21 | 确定问题:与利益无关的问题都不值得数据分析和挖掘
22 | 采集数据:用好一手数据和二手数据
特别放送 (1讲)
编辑手记 | 让生活多一些科学,少一些神学
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

22 | 采集数据:用好一手数据和二手数据

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
在上面一节课里,我们讲了如何确定我们要分析的数据问题,为整个数据分析的过程指明了方向。整个数据分析过程就像规划设计一个大的数据地图(就像玩 Simcity),先有了大的城市框架,再去规划每一个街区。
在规划这一步,测绘、逐步细化迭代非常重要。所以今天我就来给你讲讲测绘——也就是我们的数据采集。
我们进行问题决策的时候,如果没有数据采集,就会陷入经验主义,通过拍脑袋来进行决策,这不是数据分析思维的主张的方向。
现在我们有了方向和问题列表,那么数据会从哪里来呢?
我们在收集数据的时候,数据的来源会分为两大类:一手数据和二手数据。根据这些数据,我们会进行数据探索并产生一些衍生数据,最终为我们下一节课的数据分析思路组织与撰写提供弹药。

采集数据类型

我们先来看采集数据中的第一类数据来源:一手数据。一手数据主要来自企业内部的大数据平台、数据仓库以及相关系统,还有部分数据来自用户访谈和调研问卷以及内部沉淀的历史文档。
一手数据的特点就是数据可控,也正是因为数据都掌握在自己企业手中,理论上只要付出成本,我们可以拿到所有的想要的数据。也就是说,我们可以通过数据采集、建立相关流程业务系统来进行录入,或者开展大规模的用户访谈以及调研问卷去采集到我们想要的数据。这是一个企业数字资产积累的过程,现在很多企业都已经在关键业务流程上实现了数字化升级和转型。不过在数字化转型升级过程当中,有三点我觉得尤其需要注意。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
该试读文章来自付费专栏《数据分析思维课》,如需阅读全部文章,
请订阅文章所属专栏新⼈⾸单¥59
立即订阅
登录 后留言

精选留言(1)

  • 那时刻
    请问老师,数据探索过程中,有您提到的三种方法。比如在探索过程中,有了一个初步的结论,如何来校对我的初步结论的正确性呢?比如有可能是数据误差或者人为后续处理数据错误导致的问题。
    2021-09-17
收起评论
1
返回
顶部