极客视点
极客时间编辑部
极客时间编辑部
113243 人已学习
免费领取
课程目录
已完结/共 3766 讲
2020年09月 (90讲)
时长 05:33
2020年08月 (93讲)
2020年07月 (93讲)
时长 05:51
2020年06月 (90讲)
2020年05月 (93讲)
2020年04月 (90讲)
2020年03月 (92讲)
时长 04:14
2020年02月 (87讲)
2020年01月 (91讲)
时长 00:00
2019年12月 (93讲)
2019年11月 (89讲)
2019年10月 (92讲)
2019年09月 (90讲)
时长 00:00
2019年08月 (91讲)
2019年07月 (92讲)
时长 03:45
2019年06月 (90讲)
2019年05月 (99讲)
2019年04月 (114讲)
2019年03月 (122讲)
2019年02月 (102讲)
2019年01月 (104讲)
2018年12月 (98讲)
2018年11月 (105讲)
时长 01:23
2018年10月 (123讲)
时长 02:06
2018年09月 (119讲)
2018年08月 (123讲)
2018年07月 (124讲)
2018年06月 (119讲)
时长 02:11
2018年05月 (124讲)
时长 03:16
2018年04月 (120讲)
2018年03月 (124讲)
2018年02月 (112讲)
2018年01月 (124讲)
时长 02:30
时长 02:34
2017年12月 (124讲)
时长 03:09
2017年11月 (120讲)
2017年10月 (86讲)
时长 03:18
时长 03:31
时长 04:25
极客视点
15
15
1.0x
00:00/05:28
登录|注册

一文讲清推荐算法原理

讲述:丁婵大小:7.52M时长:05:28
你好,欢迎收听极客视点。
近几年,推荐算法越来越火。所谓推荐算法,其实是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西。推荐算法的价值在于帮助用户解决信息过载,做出更好的选择,这也是现在互联网领域最强大和最流行的信息发现工具之一。
日前,娱乐向机器学习解说选手莫凡在公众号“华章计算机(ID:hzbook_jsj)”发表文章,文章分析了推荐算法背后的原理,以及推荐算法为何会“失灵”。以下是重点内容。

1. 推荐算法为啥这么“灵”?

互联网最大的特点就是有海量的信息,不过,光是数量庞大是没有任何意义的,只有信息真正发挥作用才能产生价值。所以,如何让信息发挥价值,始终是互联网发展的一条主轴。
在推荐算法系统出现之前,互联网公司通常的做法是发现信息,这就是搜索引擎。搜索引擎很有用处,但限制也很明显,遗留了很多问题。比如,你要用搜索引擎找信息,不是直接就能得到想要的结果,而是得先掏出一个“关键词”输入进去,然后才能看到命中的结果,这个过程叫做信息检索。也就是说,你得先知道自己对什么信息感兴趣,得有线索,然后才能通过搜索引擎检索信息。
这样做存在一个问题:互联网实在太大了,而人的认知圈子实在太小了,这就导致大量本该有价值的信息,因为没被人看到,只能静静躺在角落里被白白浪费掉了。
推荐算法是怎么做的呢?它改变了搜索引擎的做法,不再是发现信息,而是发现兴趣。其实推荐算法的原理远没有想象中的那么复杂,用一句话概括就是:依靠人和物的关联关系,最少只要经过三次关联,就能完成兴趣发现,进行一次推荐。
比如,小明经常去一家便利店买可乐,店长就会知道小明对可乐感兴趣,这是第一次关联——小明关联可乐。店长还知道另一位顾客小华也对可乐感兴趣,这是第二次关联——小华关联可乐。不过,小华除了买可乐,还喜欢买薯片,这是第三次关联——小华关联薯片。当小明再去买可乐的时候,店长觉得,既然他俩都爱喝可乐,没准小明也喜欢薯片,于是店长就向小明推荐了薯片。这就是基于兴趣的推荐算法。
有人说,推荐算法比另一半更懂你,当你明白了推荐算法的原理,就知道这是理所当然的事情。其实推荐算法的原理并不复杂,但要想在实际中发挥好作用,还需要根据应用场景做很多调整。
推荐算法的重心在于发现人与人之间的共同点,但怎么划分共同点,是有很多不同的方法的。有基于视频节目的推荐,比如“看过这个视频的观众还看过”;也有基于地理位置的推荐,比如“同城的观众都在看”等等。
早期做推荐很简单,是基于点击量来推荐,但后来大家发现,基于点击量的推荐没法发现差异化的兴趣。所以,要想实现一套好用的推荐算法,通常要综合方方面面去考虑,而不只是单独的一两个点。

2. 推荐算法为啥有时会“失灵”?

多数时候,推荐算法是没什么问题的,但一旦出现极端情况,它就会“失灵”。比如,出现了一个爆炸话题,算法推荐的都是这个话题下的相似内容,把其他信息都湮没了。
其实这个现象可以用“长尾理论”来解释:人类社会中存在着大量的小众需求,你贩卖的东西再离经叛道,也能得到真爱的捧场,互联网就是沟通小众需求的桥梁。推荐算法在很大程度上也受了这种理论的影响,所以有一种说法是:推荐算法的最终目标就是能发现一个个小众圈子,把小众的信息推荐给圈子里的人。
此外,还有一种“失灵”的情况就是“头部效应”。很多信息占据头部,所以容易被推荐,因为容易被推荐,所以继续占据头部,形成循环。在推荐算法下,这种“头部效应”会更加明显。
这个问题应该怎么解决呢?从技术的角度看,要想解决这个问题就四个字:去极端化,把极端情况变得不那么极端就可以了。比如,很多依靠评委打分的比赛为了避免受极端情况影响,通常会选择采取去掉一个最高分和一个最低分的做法,就是类似的思路。
不过,技术本身是中立的,是正是邪,还要看使用它的人。算法自己是不会产生价值观的,算法的价值观,说到底还是人的价值观。推荐算法究竟要怎么改,说到底还是要看推荐算法的使用者怎么定义价值。
以上就是今天的内容,希望对你有所启发。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • William Ning
    推荐算法了解一波
    2
收起评论
显示
设置
留言
1
收藏
54
沉浸
阅读
分享
手机端
快捷键
回顶部