

AI 技术内参

洪亮劼

Etsy 数据科学主管，前雅虎研究院资深科学家

33455 人已学习

新⼈⾸单¥98



登录后，你可以任选6讲全文学习

课程目录

已完结/共 166 讲

开篇词 (1讲)



开篇词 | 你的360度人工智能信息助理

时长 04:57

人工智能国际顶级会议 (31讲)



001 | 聊聊2017年KDD大会的时间检验奖

时长 11:00

002 | 精读2017年KDD最佳研究论文

时长 10:35

003 | 精读2017年KDD最佳应用数据科学论文

时长 09:34

004 | 精读2017年EMNLP最佳长论文之一

时长 08:32

005 | 精读2017年EMNLP最佳长论文之二

时长 08:55

006 | 精读2017年EMNLP最佳短论文

时长 09:31

007 | 精读2017年ICCV最佳研究论文

时长 09:14

008 | 精读2017年ICCV最佳学生论文

时长 07:21

009 | 如何将“深度强化学习”应用到视觉问答系统？

时长 08:08

010 | 精读2017年NIPS最佳研究论文之一：如何解决非凸优化问题？

时长 07:27

011 | 精读2017年NIPS最佳研究论文之二：KSD测试如何检验两个分布的异同？

时长 07:27

012 | 精读2017年NIPS最佳研究论文之三：如何解决非完美信息博弈问题？

时长 06:55

013 | WSDM 2018论文精读：看谷歌团队如何做位置偏差估计

时长 08:49

014 | WSDM 2018论文精读：看京东团队如何挖掘商品的替代信息和互补信息

时长 08:00

015 | WSDM 2018论文精读：深度学习模型中如何使用上下文信息？

时长 05:04

016 | The Web 2018论文精读：如何对商品的图片美感进行建模？

时长 08:01

017 | The Web 2018论文精读：如何改进经典的推荐算法BPR？

时长 05:47

018 | The Web 2018论文精读：如何从文本中提取高元关系？

时长 06:05

019 | SIGIR 2018论文精读：偏差和“流行度”之间的关系

时长 08:35

020 | SIGIR 2018论文精读：如何利用对抗学习来增强排序模型的普适性？

时长 06:59

021 | SIGIR 2018论文精读：如何对搜索页面上的点击行为进行序列建模？

时长 07:14

022 | CVPR 2018论文精读：如何研究计算机视觉任务之间的关系？

时长 07:50

023 | CVPR 2018论文精读：如何从整体上对人体进行三维建模？

时长 06:28

024 | CVPR 2018论文精读：如何解决排序学习计算复杂度高这个问题？

时长 07:05

025 | ICML 2018论文精读：模型经得起对抗样本的攻击？这或许只是个错觉

时长 07:35

026 | ICML 2018论文精读：聊一聊机器学习算法的“公平性”问题

时长 06:36

027 | ICML 2018论文精读：优化目标函数的时候，有可能放大了“不公平”？

时长 06:22

028 | ACL 2018论文精读：问答系统场景下，如何提出好问题？

时长 07:50

029 | ACL 2018论文精读：什么是对话中的前提触发？如何检测？

时长 07:33

030 | ACL 2018论文精读：什么是“端到端”的语义哈希？

时长 07:27

复盘 7 | 一起来读人工智能国际顶级会议论文

时长 04:35

搜索核心技术 (28讲)



031 | 经典搜索核心算法：TF-IDF及其变种

时长 11:19

032 | 经典搜索核心算法：BM25及其变种（内附全年目录）

时长 09:45

033 | 经典搜索核心算法：语言模型及其变种

时长 10:08

034 | 机器学习排序算法：单点法排序学习

时长 09:33

035 | 机器学习排序算法：配对法排序学习

时长 08:38

036 | 机器学习排序算法：列表法排序学习

时长 08:07

时长 09:08

038 | “查询关键字理解”三部曲之解析

时长 07:57

039 | “查询关键字理解”三部曲之扩展

时长 07:30

040 | 搜索系统评测，有哪些基础指标？

时长 08:43

041 | 搜索系统评测，有哪些高级指标？

时长 07:17

042 | 如何评测搜索系统的在线表现？

时长 07:55

043 | 文档理解第一步：文档分类

时长 08:31

时长 07:25

045 | 文档理解的重要特例：多模文档建模

时长 07:42

046 | 大型搜索框架宏观视角：发展、特点及趋势

时长 08:30

047 | 多轮打分系统概述

时长 07:18

048 | 搜索索引及其相关技术概述

时长 07:54

049 | PageRank算法的核心思想是什么？

时长 08:01

050 | 经典图算法之HITS

时长 07:29

051 | 社区检测算法之“模块最大化 ”

时长 06:40

052 | 机器学习排序算法经典模型：RankSVM

时长 07:54

053 | 机器学习排序算法经典模型：GBDT

时长 06:56

054 | 机器学习排序算法经典模型：LambdaMART

时长 07:25

055 | 基于深度学习的搜索算法：深度结构化语义模型

时长 08:08

056 | 基于深度学习的搜索算法：卷积结构下的隐含语义模型

时长 06:42

057 | 基于深度学习的搜索算法：局部和分布表征下的搜索模型

时长 07:30

复盘 1 | 搜索核心技术模块

时长 02:37

推荐系统核心技术 (22讲)



058 | 简单推荐模型之一：基于流行度的推荐模型

时长 08:50

059 | 简单推荐模型之二：基于相似信息的推荐模型

时长 08:05

060 | 简单推荐模型之三：基于内容信息的推荐模型

时长 07:34

061 | 基于隐变量的模型之一：矩阵分解

时长 07:07

062 | 基于隐变量的模型之二：基于回归的矩阵分解

时长 07:16

063 | 基于隐变量的模型之三：分解机

时长 05:05

064 | 高级推荐模型之一：张量分解模型

时长 07:14

065 | 高级推荐模型之二：协同矩阵分解

时长 06:41

066 | 高级推荐模型之三：优化复杂目标函数

时长 06:09

067 | 推荐的Exploit和Explore算法之一：EE算法综述

时长 07:56

068 | 推荐的Exploit和Explore算法之二：UCB算法

时长 06:33

069 | 推荐的Exploit和Explore算法之三：汤普森采样算法

时长 06:28

070 | 推荐系统评测之一：传统线下评测

时长 06:34

071 | 推荐系统评测之二：线上评测

时长 06:29

072 | 推荐系统评测之三：无偏差估计

时长 06:17

073 | 现代推荐架构剖析之一：基于线下离线计算的推荐架构

时长 07:07

074 | 现代推荐架构剖析之二：基于多层搜索架构的推荐系统

时长 06:18

075 | 现代推荐架构剖析之三：复杂现代推荐架构漫谈

时长 05:41

076 | 基于深度学习的推荐模型之一：受限波兹曼机

时长 07:21

077 | 基于深度学习的推荐模型之二：基于RNN的推荐系统

时长 06:45

078 | 基于深度学习的推荐模型之三：利用深度学习来扩展推荐系统

时长 06:37

复盘 2 | 推荐系统核心技术模块

时长 02:18

广告系统核心技术 (19讲)



079 | 广告系统概述

时长 08:04

080 | 广告系统架构

时长 05:59

081 | 广告回馈预估综述

时长 06:25

082 | Google的点击率系统模型

时长 10:07

083 | Facebook的广告点击率预估模型

时长 06:33

084 | 雅虎的广告点击率预估模型

时长 05:47

085 | LinkedIn的广告点击率预估模型

时长 05:18

086 | Twitter的广告点击率预估模型

时长 06:50

087 | 阿里巴巴的广告点击率预估模型

时长 07:08

088 | 什么是“基于第二价位的广告竞拍”？

时长 06:40

089 | 广告的竞价策略是怎样的？

时长 07:00

090 | 如何优化广告的竞价策略？

时长 06:09

091 | 如何控制广告预算？

时长 05:11

092 | 如何设置广告竞价的底价？

时长 06:32

093 | 聊一聊“程序化直接购买”和“广告期货”

时长 06:03

094 | 归因模型：如何来衡量广告的有效性

时长 06:25

095 | 广告投放如何选择受众？如何扩展受众群？

时长 06:24

096 | 如何利用机器学习技术来检测广告欺诈？

时长 06:21

复盘 4 | 广告系统核心技术模块

时长 01:04

自然语言处理及文本处理核心技术 (19讲)



097 | LDA模型的前世今生

时长 11:13

098 | LDA变种模型知多少

时长 07:49

099 | 针对大规模数据，如何优化LDA算法？

时长 07:21

100 | 基础文本分析模型之一：隐语义分析

时长 05:49

101 | 基础文本分析模型之二：概率隐语义分析

时长 04:35

102 | 基础文本分析模型之三：EM算法

时长 06:35

103 | 为什么需要Word2Vec算法？

时长 06:03

104 | Word2Vec算法有哪些扩展模型？

时长 06:20

105 | Word2Vec算法有哪些应用？

时长 05:24

106 | 序列建模的深度学习利器：RNN基础架构

时长 06:58

107 | 基于门机制的RNN架构：LSTM与GRU

时长 07:17

108 | RNN在自然语言处理中有哪些应用场景？

时长 06:36

时长 07:07

110 | 任务型对话系统有哪些技术要点？

时长 06:11

111 | 聊天机器人有哪些核心技术要点？

时长 05:36

112 | 什么是文档情感分类？

时长 06:19

113 | 如何来提取情感“实体”和“方面”呢？

时长 05:39

114 | 文本情感分析中如何做意见总结和搜索？

时长 06:29

复盘 3 | 自然语言处理及文本处理核心技术模块

时长 01:30

计算机视觉核心技术 (13讲)



115 | 什么是计算机视觉？

时长 07:12

时长 06:12

117 | 计算机视觉中的特征提取难在哪里？

时长 06:10

118 | 基于深度学习的计算机视觉技术（一）：深度神经网络入门

时长 07:08

119 | 基于深度学习的计算机视觉技术（二）：基本的深度学习模型

时长 07:41

120 | 基于深度学习的计算机视觉技术（三）：深度学习模型的优化

时长 07:25

121 | 计算机视觉领域的深度学习模型（一）：AlexNet

时长 06:46

122 | 计算机视觉领域的深度学习模型（二）：VGG & GoogleNet

时长 07:08

123 | 计算机视觉领域的深度学习模型（三）：ResNet

时长 05:37

124 | 计算机视觉高级话题（一）：图像物体识别和分割

时长 05:51

125 | 计算机视觉高级话题（二）：视觉问答

时长 04:51

126 | 计算机视觉高级话题（三）：产生式模型

时长 06:06

复盘 5 | 计算机视觉核心技术模块

时长 01:21

数据科学家与数据科学团队养成 (25讲)



127 | 数据科学家基础能力之概率统计

时长 10:20

时长 11:40

129 | 数据科学家基础能力之系统

时长 09:35

130 | 数据科学家高阶能力之分析产品

时长 10:30

131 | 数据科学家高阶能力之评估产品

时长 11:16

132 | 数据科学家高阶能力之如何系统提升产品性能

时长 09:35

133 | 职场话题：当数据科学家遇见产品团队

时长 08:25

134 | 职场话题：数据科学家应聘要具备哪些能力？

时长 09:14

135 | 职场话题：聊聊数据科学家的职场规划

时长 08:17

时长 11:18

137 | 数据科学团队养成：电话面试指南

时长 08:38

138 | 数据科学团队养成：Onsite面试面面观

时长 07:50

139 | 成为“香饽饽”的数据科学家，如何衡量他们的工作呢？

时长 08:25

140 | 人工智能领域知识体系更新周期只有5～6年，数据科学家如何培养？

时长 07:41

141 | 数据科学家团队组织架构：水平还是垂直，这是个问题

时长 07:59

142 | 数据科学家必备套路之一：搜索套路

时长 09:17

143 | 数据科学家必备套路之二：推荐套路

时长 07:35

144 | 数据科学家必备套路之三：广告套路

时长 06:53

145 | 如何做好人工智能项目的管理？

时长 07:12

146 | 数据科学团队必备的工程流程三部曲

时长 08:06

147 | 数据科学团队怎么选择产品和项目？

时长 07:25

148 | 曾经辉煌的雅虎研究院

时长 10:41

149 | 微软研究院：工业界研究机构的楷模

时长 08:18

150 | 聊一聊谷歌特立独行的混合型研究

时长 06:27

复盘 6 | 数据科学家与数据科学团队是怎么养成的？

时长 02:13

热点话题讨论 (7讲)



151 | 精读AlphaGo Zero论文

时长 09:57

152 | 2017人工智能技术发展盘点

时长 08:57

153 | 如何快速学习国际顶级学术会议的内容？

时长 08:10

154 | 在人工智能领域，如何快速找到学习的切入点？

时长 07:36

155 | 人工智能技术选择，该从哪里获得灵感？

时长 06:44

156 | 近在咫尺，走进人工智能研究

时长 07:42

内参特刊 | 和你聊聊每个人都关心的人工智能热点话题

时长 19:50

结束语 (1讲)



结束语 | 雄关漫道真如铁，而今迈步从头越

时长 04:43



AI 技术内参





00:00/00:00

登录|注册

069 | 推荐的Exploit和Explore算法之三：汤普森采样算法

洪亮劼



该思维导图由 AI 生成，仅供参考

周三的分享里，我们讨论了一种叫作 UCB（Upper Confidence Bound）的算法。这种算法的核心是使用均值和标准差组成对物品的估计，并且利用这种估计达到 EE 的效果。同时，我们也提到，UCB 的最大问题就是并没有真正达到随机的效果。
今天，我们来看一种不太一样的算法，叫“汤普森采样”（Thompson Sampling）。
为什么需要随机采样？在讨论汤普森采样之前，我们先来看一看什么是随机采样。随机采样的技术和概率分布密不可分，也和计算机产生随机数有很大的联系。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

汤普森采样算法是一种解决UCB算法“确定性”问题的重要算法。文章首先介绍了为什么需要引入随机采样机制，随后详细解释了汤普森采样的基本原理。该算法通过从模型的后验分布中进行抽样，实现了真正的随机效果。汤普森采样的优势在于其随机性，能够尊重点击率的数值大小，解决了UCB算法的问题。此外，由于使用了贝叶斯统计，对于当前点击率估计不准确甚至没有数据的物品也具有天然优势。总之，汤普森采样算法在解决UCB算法问题的同时，实现了真正的随机效果，为推荐系统的优化提供了重要思路。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

© 版权归极客邦科技所有，未经许可不得传播售卖。页面已增加防盗追踪，如有侵权极客邦将依法追究其法律责任。

登录后留言

全部留言(2)

最新
精选

兔子ORZ
后验分布很复杂的时候，Thompson采样收敛速度会很慢。可以尝试更高级的采样方式 Importance Sampling或者MCMC，Gibbs呢
2018-04-11

1
林彦
当被采样的物品点击率很接近时，这些物品会一直被计算和采样。可能会比较耗时
2018-03-23



收起评论



显示
设置



留言

2



收藏



沉浸
阅读



分享



手机端



快捷键



回顶部