数据分析思维课
郭炜
前易观 CTO
38045 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

14 | 初识聚类算法:物以类聚,让复杂事物简单化

思维方式
K-Means算法
聚类算法的作用
应用领域
行为轨迹
用户画像
图片、声音、视频聚类
聚类收敛
帮派大会
拉帮结派
选大哥
K-Means算法
投资
人群探查
数据整理
动物分类
郭炜
小结
未来场景的展望
聚类算法初探
聚类问题与场景
内聚和分离
无监督学习
数据分析思维课
课后思考
聚类算法
物以类聚
参考文章

该思维导图由 AI 生成,仅供参考

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
“物以类聚”这个成语想必你肯定不陌生,我们会自然地把很多类似的事物放到一起,给出一个统一的定义。因为我们的大脑空间有限,无法接收太多零碎的信息。
比如我们会把动物按照门纲目科属种来进行归类:对于一只小狗来说,无论它是白毛还是黑毛,秋田还是藏獒,我们都会知道它属于狗。这其实就是我们面对纷繁复杂的世界的一种算法。
对于数据来说也是如此,如果大量的数据没有一个很好的算法来进行整理,那么这些数据可能我们就无法理解。如何将大数据分门别类聚集起来让人理解,就是今天要给你讲的算法——聚类。

聚类问题与场景

花对你来说肯定很熟悉,我们在生活中会看到各种各样的花。无论是梅花、菊花还是鸢尾,我们都会把它称作是花,而不是把它叫做叶子。因为它们身上有类似的特征,和叶子有比较大的区别。
简单来说,不同的花之间有一些比较相近的特性:花都有花瓣也有花蕊,颜色也都比较鲜艳。我们把这种现象叫做内聚。而花和叶子相比,叶子在大多情况下形状不会特别复杂,并且大多是绿色,所以花和叶子之间的差异很大。我们把这个特性叫做分离
聚类就是通过一些算法,把这些事物自动全都聚集起来,让这些聚好的类别(花类和叶子类)达到内聚和分离的特性。你可以从下面的图里更直观地看到,一个好的聚类算法算出来以后,可以把相近的东西全都聚到一起,并且不相近的全都能区分开。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

聚类算法在数据分析中扮演着重要角色,本文通过生动的比喻和简洁的语言,向读者介绍了聚类算法的基本原理和应用场景。文章以花和叶子的类比,说明了聚类算法的内聚和分离特性,以及在人群探查和投资分析中的应用。详细介绍了K-Means聚类算法的实现方法,并强调了在使用聚类算法时需要注意剔除异常点以确保准确性。此外,文章展望了聚类算法在未来可以实现图片、声音、视频的聚类,以及在用户画像、医疗科研研究等领域的应用。最后,鼓励读者在工作或生活中尝试用聚类思想解决复杂事物,以提高思维结构化能力。整体而言,本文为读者提供了对聚类算法的全面了解,为进一步深入学习提供了良好的基础。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(18)

  • 最新
  • 精选
  • 晓涛
    请教下人群聚集度的那个事情具体是怎么做的

    作者回复: 简单的做法就是使用Heatmap,把客流位置进行描述统计。复杂的做法是使用DbScan算法,形成聚类,再渲染分层。

    2021-08-30
    2
    6
  • 小蜗
    读文献的工作,尤其是一天下来对所读文献的归类、笔记,否则就白读了,下次打开又不知道这篇文章讲啥。

    作者回复: 是的,好脑子不如烂笔头

    2021-09-14
    4
  • 那时刻
    请问老师,我们在做用户画像的时候,也会用聚类把一个人最常见的行为属性聚集出来,这里常见行为,指的是行为的统计计数么?比如老师喜欢住威斯汀酒店,是因为住的次数多么?

    作者回复: 最简单的是通过统计规则来定义标签,复杂一些的是先把人群做各种聚类,然后通过数据统计把这一类人给一个标签,例如白富美,还有可以分类,确定目标人群,然后类似人打上标签等等

    2021-08-30
    1
  • 80分
    分类能力也能体现对一件事情的认知程度。可以根据dikw四层次模型来衡量: - data数据 - information信息 - knowledge知识 - wisdom智慧
    2021-09-21
    12
  • 睡前不玩手机
    选大哥真是个绝妙的比喻
    2021-10-09
    10
  • geigei
    矛盾也可以进行分类:是敌我矛盾还是人民内部矛盾,然后人民内部矛盾还可以往下分是财产纠纷还是其他纠纷~~,感觉掌握了聚类的思想,我们看待事物会更加结构化,能看到全景图。
    2021-10-28
    4
  • SVV
    对于多渠道获得的用户需求,其实也会需要应用聚类算法来转化为不同的需求维度,进而理解用户的不同需求场景,最后确定解决方案的优先级。
    2021-09-13
    4
  • 进化菌
    物以类聚,人以群分。 人类确实很了不起,能够把各种东西分门别类。分门别类除了方便记忆,还可以更好的处理问题,比如有毒的蛇需要小心提防。 聚类算法 K-Means,说的很形象,大哥从开始的几个人,到成群结队,这个过程是在聚合的过程。 就好像,我们的朋友,都是认可彼此才聚在的一起,甚至看起来有点自动化处理,不费多少力气~
    2021-08-30
    3
  • 阿德
    哲学就是对生活、人性的高度归类总结
    2021-11-12
    1
  • 静渊
    多用聚类算法的方式去思考,可以把你的思维锻炼得更加结构化,助你更快理清琐碎的生活。
    2023-09-02归属地:广东
收起评论
显示
设置
留言
18
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部