AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33455 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

083 | Facebook的广告点击率预估模型

在线学习
特性筛选
非线性组合
训练模型的经验
选取特性的经验
第二层模型:线性分类器
第一层模型:GBDT树
NE的衡量方式
AUC的局限性
广告数量巨大
精准定位用户
思考题
两层模型架构
评测指标
Facebook广告特点
作者经验分享
两层模型架构
评测标准:AUC、NE
数据不均衡挑战
规模增加挑战
社交广告特点
流行模型:对数几率回归、数模型
难点和挑战:数据稀疏
预测用户与广告的交互和达成交易的概率
总结
层次化的点击率预估模型
广告点击率的评估
Facebook广告预估
广告回馈预估
广告点击率预估模型

该思维导图由 AI 生成,仅供参考

上一篇文章我们讲了整个计算广告领域最核心的一个问题:广告回馈预估。广告回馈预估,就是预测“用户与广告的交互以及达成交易这种行为”的概率,也就是点击率预估和转化率预估。广告回馈预估存在着数据稀疏等难点和挑战,目前在这个领域比较流行的模型有对数几率回归和数模型等。
今天,我们就来看一个广告回馈预估的实例:Facebook 的广告点击率预估。我们会结合 2014 年发表的一篇论文《Facebook 的广告点击率预估实践经验》(Practical Lessons from Predicting Clicks on Ads at Facebook)来进行分析[1]。

Facebook 广告预估

Facebook 的广告不是我们之前介绍过的搜索广告或者展示广告的简单应用,而是社交广告。可以说,社交广告是最近 10 年慢慢崛起的一种新的广告类型。在论文发表的时候,也就是 2014 年,Facebook 有 7.5 亿“日活跃用户”(Daily Active Users)和超过 1 百万的广告商,这个数字在当时是相当惊人的。而今天,在 Facebook 上活跃的大约有 14.5 亿用户和 5 百万广告商。因此,广告系统所需要应对的规模是成倍增加的。
我们说 Facebook 的广告是社交广告,也就是说,这些广告不依赖于用户输入的搜索关键词。从 Facebook 的角度来说,广告商在其平台上投放广告的巨大优势,在于能够精准地根据用户的地理位置、年龄、性别等重要信息进行有针对性的投放,因此这些信息能够帮助平台选择什么样的广告适合什么样的人群。那这里的难点就是,对于某一个人群来说,可能符合的广告数量是巨大的,这对广告的回馈预估以及整个系统都是一个不小的挑战。

广告点击率的评估

在我们详细解释 Facebook 点击率系统的一些核心组件之前,我们首先来看一看 Facebook 的研究人员是怎么评测他们的系统的。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

Facebook的广告点击率预估模型是针对社交广告的一种特殊应用,其核心挑战在于数据稀疏和不均衡。文章介绍了Facebook广告点击率预估的评估方法和模型架构。在评估方面,文章提到了AUC和NE作为评测指标,强调了AUC的局限性,同时引入了归一化的交叉熵作为新的评价指标。在模型架构方面,Facebook团队提出了一个两层模型,首先通过GBDT进行特征转换,然后再经过线性分类器进行最终的预测。这种层次化的模型架构在特征转换和模型训练方面具有一定的优势。文章还提到了一些关于特征选择和模型训练的经验,强调了历史信息对广告点击率预测的重要性。总的来说,Facebook的广告点击率预估模型在应对社交广告的特殊性和挑战性方面提出了一些创新的解决方案,对于理解广告点击率预估模型的设计和评估具有一定的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(9)

  • 最新
  • 精选
  • 帅帅
    反正加个GBDT就是比单纯的LR好就对了
    2019-01-16
    1
    1
  • 艾熊
    hi,因为这篇论文是2014年发的,想问一下现在Facebook还是基于这个模型来做广告ctr预估吗?这个模型适用和不适用的规模和场景可以分享一下吗?
    2018-06-20
    1
  • 星星之火
    老师能不能讲下具体的实现,架构中的难点
    2018-06-15
    1
  • bookchan
    NCE在训练的时候,相比CE,只是多了个常数项,对求梯度的效果只是多了个系数的作用,可以等同于原来的学习率乘以这个系数,这么看的话对训练其实帮助是不大的,因为不同数据集使用不同学习率常事。但在其他场景下,比如同一个模型,使用不同的训练数据来训练,那么怎么评价不同数据训练出来的模型效果?这时候使用NCE,就能够消除不同数据集自身数据分布对loss的影响(极端假设A数据集正样本偏多,B数据集都是负样本偏多,那么他们的NCE也许会一样,但是模型的效果是不一样的,A随便预测正类就好了,指标就会很高,但是B则难很多)。
    2021-01-27
  • Geek_fa0c60
    写的好浅。就是网上的一些文章的堆砌而已。 我们不需要看很多,只希望有一些详细的,深入的介绍
    2020-11-21
  • 夏洛克的救赎
    如何了解谷歌的广告模型
    2018-09-27
  • arfa
    老师,id怎么加进模型?
    2018-09-13
  • 夏洛克的救赎
    老师怎么看待微信广告现状和前景?
    2018-09-10
  • 无需人工特征工程也是优势,缺点应是gbdt的离线更新以及预测时间消耗
    2018-06-11
收起评论
显示
设置
留言
9
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部