数据分析思维课
郭炜
前易观CTO
新⼈⾸单¥59.9
2267 人已学习
课程目录
已更新 18 讲 / 共 33 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (2讲)
开篇词 | 数据给你一双看透本质的眼睛
免费
导读 | 万物背后的规律都是数据
数据分析基础 (11讲)
01 | 平均值:不要被骗了,它不能代表整体水平
02 | 大数定律与小数陷阱:生活是随机还是有定数的?
03 | 数据的期望值:为什么你坐的飞机总是晚点?
04 | 随机对照试验:章鱼保罗真的是“预言帝”么?
05 | 直方图与幂分布:为什么全世界1%的人掌握着50%的财富?
06 | 数据分布:房子应该是买贵的还是买便宜的?
07 | 散点图和相关性:怎样快速从数据当中找到规律?
08 | 标准差:这人是不是“靠谱”其实看标准差?
09 | 数据抽样:大数据来了还需要抽样么?
10 | 指数和KPI:智商是怎么计算出来的?
11 | 因果倒置:星座真的可以判定你的性格吗?
数据算法基础 (4讲)
12 | 精确率与置信区间:两种预测,你究竟应该相信哪一个?
13 | 趋势分析与回归:父母高,孩子一定高么?
14 | 初识聚类算法:物以类聚,让复杂事物简单化
15 | 初识分类算法:分而治之,不断进化
特别放送 (1讲)
编辑手记 | 让生活多一些科学,少一些神学
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

15 | 初识分类算法:分而治之,不断进化

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
通过上节课讲的聚类算法,你应该知道了我们经常把一些复杂的事物通过聚类来进行简化处理。但是,不一定所有事物在一开始我们都要把它们进行聚类。有的东西我们一开始就知道一些正确和错误事例,例如我们知道什么是好人什么是坏人,然后得让孩子慢慢明白好人和坏人的差别,让孩子去学会鉴别哪些人是好人还是坏人。
又比如说在上海做垃圾分类的时候,有这么一个段子:你去倒垃圾,一个阿姨就会在那里看着你,看到你就会问“你是什么垃圾?”你如果把垃圾分类做错了,她会告诉你榴莲壳属于干垃圾,瓜子壳属于湿垃圾。下次如果你去倒垃圾还不对,她还会纠正你,直到你最后学会为止。刚刚给你举的这两个例子其实就和我们这节课的主角分类算法脱不开干系。

分类算法定义与场景

和聚类算法不同,分类算法是有训练数据集的,也就是我们在一开始就已知有一系列正确的数据和正确的分类结果,然后你需要经过不断地学习去找到其中的规律,然后做一些测试数据,最终在生产环境里去帮你去判断一些事物的分类。
可能这么解释有点绕,其实这就像我们让孩子去做算术题一样,先告诉他计算正确的一些案例,让他去领悟其中的一些规则,然后继续做一些算术题练习,最后再去做考试。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
该试读文章来自付费专栏《数据分析思维课》,如需阅读全部文章,
请订阅文章所属专栏新⼈⾸单¥59.9
立即订阅
登录 后留言

精选留言(1)

  • 进化菌
    分而治之,是处理复杂事物的好办法。
    就好像,企业里面有多个项目,不同部门的人管理不同类型的项目,不断迭代,这样更省力。
    2021-09-01
收起评论
1
返回
顶部