AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

084 | 雅虎的广告点击率预估模型

利用树模型对平滑结果进行修正
利用产生式模型的概念
利用层次信息对原始估计值进行修正
大量数据的采样和配对特性的利用
特性哈希的使用
对数几率回归
第二层模型:对第一层模型的修正,利用层次化信息进行平滑
第一层模型:直接估计点击率
模型对罕见事件的估计不稳定
[4] Simple and Scalable Response Prediction for Display Advertising
[3] Temporal multi-hierarchy smoothing for estimating rates of rare events
[2] Estimating rates of rare events with multiple hierarchies through scalable log-linear models
[1] Estimating rates of rare events at multiple resolutions
如何在对数几率回归中引入层次化的平滑思路
后期模型回归到更加简单的架构
早期模型重点在两层模型架构上
效果提升
一层模式
两层模型架构
数据稀疏性带来的挑战
参考文献
思考题
总结
雅虎后期的广告预估模型
雅虎早期的广告预估模型
雅虎的广告点击率预估模型

该思维导图由 AI 生成,仅供参考

在上一篇文章中,我和你分享了广告回馈预估的一个实例:Facebook 的广告点击率预估。我们重点讲了 Facebook 利用“归一化的交叉熵”这个概念,来衡量广告模型的精准度。另外,我们还分享了 Facebook 提出的两层模型架构,也就是一开始先利用树模型 GBDT 来对特性进行非线性转换和选择,然后再利用一个在线学习的线性模型进行最后的预测,这个架构后来得到了很多研究者和实践者的追随。
今天,我们来分析另外一个经典的公司实例:雅虎的广告点击率预估模型

雅虎早期的广告预估模型

对于曾经的互联网巨头雅虎来说,广告系统很早就成为其重要的经济支柱。早在 2007 年甚至更早的时候,雅虎的工程师和研究人员就投入到了对广告点击率预估的研究中。这方面的几个代表作我列在了文末的参考文献([1]、[2]和[3])里,如感兴趣,你可以进一步学习。
我们在这里集中讲讲这些工作的核心思路。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

雅虎的广告点击率预估模型经历了从复杂的两层模型到简单的一层模型的转变。早期,雅虎的工程师和研究人员致力于解决广告点击率预估模型中的数据稀疏性问题,提出了一种两层模型架构,利用层次化信息对原始估计值进行修正,以实现更精确的预测。然而,这种方法变得复杂且环节繁多。后期,雅虎转向更简单和可扩展的方法,采用一层模型,主要使用对数几率回归,并大量应用特性哈希和特性配对等方法。研究表明,这种简化的方法相比之前的两层结构取得了显著的效果提升。 总的来说,雅虎的广告点击率预估模型经历了从复杂到简单的演变过程,早期注重层次化信息的平滑处理,后期则更注重模型的简化和可扩展性。这一演变过程体现了雅虎在广告点击率预估领域的不断探索和创新。文章提供了对于广告点击率预估模型发展的深入了解,并引发了对于如何在线性模型中引入层次化平滑思路的思考。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部