成为 AI 产品经理
刘海丰
京东高级架构师
23717 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
成为 AI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

09 | K近邻算法:机器学习入门必学算法

业务场景中是否适合应用KNN算法
处理大数据集耗时
对数据容错性低
适用于小数据集
处理边界不规则数据的分类效果好
简单易懂,无需训练
商品推荐系统
预测候选人能否拿到Offer
对待测样本点周围最近的K个样本点进行分类决策
基于距离计算的分类算法
课后讨论
缺点
优点
应用场景
原理
KNN算法

该思维导图由 AI 生成,仅供参考

你好,我是海丰。
今天,我们正式进入算法的学习,来学习 K 近邻算法(K-Nearest Neighbor),简称 KNN 算法。它是一种用来解决分类问题的算法,简单来说,就是用来预测用户是男是女,或者是否喜欢某件商品。分类算法有很多,只不过,不同算法的实现机制不同,我们今天要讲的 KNN 算法是基于距离计算的方式来解决分类问题的。
下面,我就借助生活中常见的例子,给你讲清楚 KNN 算法的原理、优缺点,以及应用场景。

如何理解 KNN 算法

我们的生活中总是充斥着各种各样的小抉择,这些抉择虽然对我们的影响不大,但总会让我们有些苦恼。比如,手机买什么牌子、买什么型号?午饭吃什么?周末陪女朋友去哪儿玩?你每次遇到这类问题的时候,都会怎么解决呢?
先别着急回答,我们先来做一个小测试题。如果现在就让你给女朋友选礼物,你会怎么做?我希望你能在 5 秒内,从下面 3 个选项中选一个:
随便选一个就行了
问问周围兄弟们都送了什么礼物
做一份详细的报告,根据女朋友的情况量身定制礼物挑选方案
好了,我想你有很大可能会选择第 2 个选项。因为选 1,就意味着你会承担更高的风险,选到一个非常不靠谱的礼物,还很有可能踩雷,而选 3 意味着你会花费大量的时间和成本去做准备,一般人估计也没有这么大的耐心。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

K近邻算法(K-Nearest Neighbor,简称KNN)是一种基于距离计算的分类算法,适用于解决分类问题。该算法简单易懂,无需训练即可进行预测,对边界不规则数据的分类效果较好。然而,KNN算法对大数据集的处理效率较低,且对数据容错性较低,对数据分布不均衡的情况也表现不佳。在实际应用中,选择合适的K值对模型的预测效果至关重要,需要通过不断尝试并对比准确率来确定最佳的K值。此外,KNN算法还可以应用于推荐系统,通过计算用户之间的相似度来进行个性化推荐。产品经理在业务场景中应该了解KNN算法的优缺点,以便评估其适用性,并提出建设性的建议。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(15)

  • 最新
  • 精选
  • Geek_542a30
    KNN 核心原理你可以理解为“近朱者赤近墨者黑”,老师解释的很形象啊!我目前不打算深入了解具体算法原理,就是想大致了解一下,以后和模型工程师可以聊聊。您这个解释让我一下子能知道这个算法是什么,很赞!

    作者回复: 谢谢,你是一个有想法的产品经理!

    2021-01-11
    9
  • 徐榕泽
    老师,这个K值到底是如何计算出来的呢?文章里说一个一个试试,那试的标准是什么?
    2021-02-08
    5
    6
  • April王燕
    老师的讲解让我一下子对算法的理解有了思路,核心原理,应用场景,优缺点,而且通过场景代入,容易理解,但是有一点,对于成熟的主流电商系统,其推荐算法应该比这个要复杂很多吧,如果有类似拆解的课程就更完美啦
    2023-02-27归属地:湖北
    2
  • 我是大幂幂
    对K的取值说的不清不楚。如果是二分类问题,恐怕这个k只能取奇数吧,不然出现两个分类各占半的情况如何进行分类?
    2022-12-30归属地:广东
    2
  • 有机体
    数据量 大 怎么界定
    2022-01-11
    1
    2
  • AsyDong
    电商平台里那种看过此商品的人还喜欢XXX这种场景是通过KNN算法推荐
    2021-02-02
    2
    2
  • Geek_531536
    老师你好,“所以,对于 K 的取值,一种有效的办法就是从 1 开始不断地尝试,并对比准确率,然后选取效果最好的那个 K 值。” 请问这句是不是这样理解:这是个调参过程,是不是用已知的样本来计算,从而选取效果最好的那个K值,然后用这个K值预测未知样本的分类? 毕竟不知道未知样本是哪个分类,因而也不清楚它的分类是否正确。
    2022-05-18
    1
  • 俯瞰风景.
    KNN算法可以用于寻找认知边界,兴趣边界。通过研究学习兴趣相似的同学的学习内容,可以实现个性化的学习内容推荐。
    2021-08-26
    1
  • Rosa rugosa
    各种推荐场景如视频推荐,音乐推荐,商品推荐。
    2021-03-12
    1
  • cesc
    房产的推荐可以使用K近邻算法
    2024-02-19归属地:上海
收起评论
显示
设置
留言
15
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部