深度学习推荐系统实战
王喆
Roku资深机器学习工程师,推荐系统架构负责人,前Hulu高级研究员,《深度学习推荐系统》作者
新⼈⾸单¥19.9
1517 人已学习
课程目录
已更新 3 讲 / 共 33 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词|从0开始搭建一个深度学习推荐系统
免费
基础架构篇 (2讲)
01|深度学习推荐系统的经典技术架构长啥样?
02|Sparrow RecSys:我们要实现什么样的推荐系统?
深度学习推荐系统实战
15
15
1.0x
00:00/00:00
登录|注册

01|深度学习推荐系统的经典技术架构长啥样?

王喆 2020-09-21
你好,我是王喆。从今天开始,我们正式开始学习“深度学习推荐系统”了。在开始之前,我想先问你一个问题:当你开始学习一个全新领域的时候,你想做的第一件事情是什么?
当然每个人可能都有自己的答案,但对于我自己来说,我最想搞明白的是两个问题。一个是,这个领域到底要解决什么问题?第二个是,这个领域有没有一个非常高角度的思维导图,让我能够了解这个领域有哪些主要的技术,做到心中有数?
针对“深度学习推荐系统”这个领域啊,可能还会有第三个问题,为什么我们要一直强调“深度学习”,深度学习到底给推荐系统带来了什么革命性的影响?相信听完了这一节课,你心中的这三个问题也都能迎刃而解。

推荐系统要解决的根本问题是什么?

在开篇词中我们提到,推荐系统的应用已经渗透到购物、娱乐、学习等生活的方方面面,虽然商品推荐、视频推荐、新闻推荐这些推荐场景可能完全不同,既然它们都被称为“推荐系统”,解决的本质问题一定是相通的,遵循着共通的逻辑框架。
推荐系统要解决的问题用一句话总结就是,在“信息过载”的情况下,用户如何高效获取感兴趣的信息。
因此,推荐系统正是在“浩如烟海的互联网信息”和“用户的兴趣点”之间,搭建起的一座桥梁。那这座桥是怎么一步步搭建起来的呢?下面,我们先来看看,推荐系统比较抽象的逻辑架构是什么样的,再一步步搭建起它的技术架构,让你对推荐系统有一个整体上的印象。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《深度学习推荐系统实战》,如需阅读全部文章,
请订阅文章所属专栏新⼈⾸单¥19.9
立即订阅
登录 后留言

精选留言(7)

  • 朱月俊
    数据部分:event distribution, hadoop, query results, netflex.hermes, user event queue, netflix.manhattan.
    模型部分:model training, models, online computation, online service, algorithm service.

    作者回复: 赞,完全正确。另外nearline computation也属于数据部分,正中央的evcache等几个数据库可以看作数据部分和模型部分的接口。

    2020-09-22
    3
  • 李@君
    Netflix的离线数据处理部分,还在使用hive和pig技术吗。

    作者回复: 这张图是netflix 2015年发布的,所以有些技术肯定会更新。在这里仅作为大家练习使用。

    2020-09-23
  • 李@君
    老师,spark和flink都兼具批处理和流处理的能力,技术选型时为什么不使用其中一个呢。文中所提到的实时处理,又实用的是什么技术呢。模型在线更新时,是使用新产生的的数据再对模型进行训练吗,这样的话会不会太耗时,影响功能。

    作者回复: 问题比较多,可能需要在后续课程中深入讨论。不是一两句话能讲清楚。

    简单来讲数据流部分是每个公司最复杂的部分,其中有历史原因,也有各平台配合的原因。比如Spark目前来讲相比Flink还是更适用于批量大数据处理,而Flink基于流的思想提出,天然更适合流处理。具体的选型,各平台之间的配合,我们在后续对应章节再详细讨论。

    2020-09-23
  • 军舰
    老师,候选物品库是不是可以这样理解:我现在在看柯南,那么候选物品可能是动画片、侦探题材等?

    作者回复: 候选物品库是所有可被推荐的物品集合。比如一个动漫视频网站,他的候选物品可以是 柯南,海贼王,七龙珠等等,但动画片,侦探题材这些属于物品上的特征,并不是候选物品。

    2020-09-22
  • fsc2016
    老师,这套课程侧重点和您的书《深度学习推荐系统》区别是什么了,更偏实战嘛

    作者回复: 是的,专栏的名字是《深度学习推荐系统实战》,所以会更注重理论联系实际,用一套代码SparrowRecSys把所有重要的知识点实现一遍,最后串联成一套成型的推荐系统。

    2020-09-22
  • Four y
    老师,请问关于大数据数据出口的那一部分,请问实时的用户推荐请求也是会先经过大数据处理,生成可供线上推理的数据吗?就是针对文中大数据出口的第二点。

    作者回复: 这是个好问题,希望大家多提这样的思考。
    在推荐服务器做线上推断时,实时用户请求里面包含的特征一般是直接在服务器内部提取出来的,所以肯定不需要再在数据流中走一遍。

    但是线上请求数据最终还是会落盘,生成日志数据,这个过程中,一些流处理,和批处理的平台会对这些数据做进一步处理,生成今后可供使用的特征以及训练用样本。

    2020-09-22
  • 少刷票圈多读书
    王喆老师对应的知乎专栏文章:https://zhuanlan.zhihu.com/p/114590897

    作者回复: 嗯,基本算是课后问题的详细解答了。

    2020-09-22
收起评论
7
返回
顶部