数据分析思维课
郭炜
前易观 CTO
38045 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

15 | 初识分类算法:分而治之,不断进化

生成决策树的步骤
逐级找领导算法
人类自身的分类决策
车牌自动识别
客户流失预警
思考与进化
核心思想
脑机接口与深度学习
模拟小狗鼻子的分类训练
应用于人工智能图像识别
C4.5决策树算法
应用场景
有监督学习
小结
未来场景的展望
初探
定义与场景
分类算法

该思维导图由 AI 生成,仅供参考

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
通过上节课讲的聚类算法,你应该知道了我们经常把一些复杂的事物通过聚类来进行简化处理。但是,不一定所有事物在一开始我们都要把它们进行聚类。有的东西我们一开始就知道一些正确和错误事例,例如我们知道什么是好人什么是坏人,然后得让孩子慢慢明白好人和坏人的差别,让孩子去学会鉴别哪些人是好人还是坏人。
又比如说在上海做垃圾分类的时候,有这么一个段子:你去倒垃圾,一个阿姨就会在那里看着你,看到你就会问“你是什么垃圾?”你如果把垃圾分类做错了,她会告诉你榴莲壳属于干垃圾,瓜子壳属于湿垃圾。下次如果你去倒垃圾还不对,她还会纠正你,直到你最后学会为止。刚刚给你举的这两个例子其实就和我们这节课的主角分类算法脱不开干系。

分类算法定义与场景

和聚类算法不同,分类算法是有训练数据集的,也就是我们在一开始就已知有一系列正确的数据和正确的分类结果,然后你需要经过不断地学习去找到其中的规律,然后做一些测试数据,最终在生产环境里去帮你去判断一些事物的分类。
可能这么解释有点绕,其实这就像我们让孩子去做算术题一样,先告诉他计算正确的一些案例,让他去领悟其中的一些规则,然后继续做一些算术题练习,最后再去做考试。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入介绍了数据分析中的分类算法,着重介绍了C4.5决策树算法。文章首先解释了分类算法与聚类算法的区别,强调了分类算法在有监督学习中的重要性,并以客户流失预警和车牌自动识别为例,说明了分类算法在实际应用中的价值。接着详细介绍了C4.5决策树算法的逻辑和步骤,以及如何通过信息熵来选择最优的属性进行分类。最后,展望了分类算法在人工智能图像识别等领域的广泛应用,并强调了分类算法的核心在于经验不断积累,不断迭代自己的规则,从而得到最佳答案。文章通过生动的比喻和具体的案例,生动地介绍了分类算法的基本原理和应用场景,对读者快速了解分类算法具有很好的指导意义。文章最后呼吁读者用分类算法的视角去看待“复盘”这件事,持续迭代自己的分类规则,持续进化。文章内容深入浅出,为读者提供了全面的分类算法知识概览,具有很高的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(8)

  • 最新
  • 精选
  • Haoz
    这门课让我想起了达利欧的《原则》,分类算法中的选领导可以理解为在生活工作中提炼我们的原则,并不断地打磨这些原则,并让这些原则指导我们如何更好的生活和工作

    作者回复: 这也是我特别喜欢的一本书,感谢这么高的评价啊!

    2021-10-26
    7
  • Geek_57d86f
    跟小朋友沟通的过程中有个启发,小朋友的大脑还是一颗初见雏形、正在不断吸收新知识的小树,而成年人的分类树往往已经固定成形,我们做决策时往往会更凭经验。凭经验的结果往往正确但毫无新意,小孩子经过全新学习和思考后给出的结论反而会给大人更多启发。所以无论什么年纪,对新鲜事物、新知识保持敬畏和学习之心,持续迭代我们自己的决策树,学习像孩子一样思考

    作者回复: 要保持好奇心,做好很容易,如何更好?做到最好?这非常难了

    2021-11-09
    3
  • 80分
    聚类是无监督学习,分类是有监督学习。
    2021-09-21
    2
    12
  • geigei
    这节课让我想起康熙年间,九子夺嫡的场面,不知道那个儿子有本事,那就比比看,虽然过程比价残忍,但最后还是选出了老四(雍正),雍正即位后开始了剪枝操作,对于自己没什么用的前朝老臣也丝毫不含糊,这应该就是一个分类算法的现实应用吧
    2021-10-28
    7
  • 第三步,为什么是取信息熵小的做大领导?不应该是取信息熵大的吗?
    2021-09-04
    4
    4
  • 进化菌
    分而治之,是处理复杂事物的好办法。 就好像,企业里面有多个项目,不同部门的人管理不同类型的项目,不断迭代,这样更省力。
    2021-09-01
    4
  • 数据分析星球
    选领导就是在找区分度大的特征,找到这个特征后,还要确定一个阈值进行分割,然后逐层进行下去,决策树的基本思路
    2022-09-15归属地:安徽
  • Johnson Chan
    停车场那快我更倾向于使用的OCR或者模版匹配,而不是分类器。 毕竟车牌的字体是统一的,建立模版然后匹配输出结果; 分类更像是将不同字体的0都归到“0”这一类里
    2022-07-18
收起评论
显示
设置
留言
8
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部