087 | 阿里巴巴的广告点击率预估模型

洪亮劼



该思维导图由 AI 生成，仅供参考

今天，我们继续来进行点击率预估的案例分析，结合三篇核心论文，来看一看阿里巴巴的广告预估又有哪些值得我们学习的地方。
多段线性模型我们之前介绍了多个公司关于点击率或者转化率预估的案例。从这些案例中，你可能已经发现有两个非常重要的特征需要机器学习模型来处理。
第一，就是数据中呈现的非线性化的关系。也就是说，我们的模型必须在某一个地方考虑到特性之间的非线性表征，以及对于目标标签的非线性关系。
第二，就是数据的不均衡以及数据的稀疏性。有很多广告商是新广告商，很多广告是新广告。在这样的情况下，我们就必须要处理“冷启动”和“热启动”这两种局面。
在《从广告点击率预估的大规模数据中学习多段线性模型》（Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction）[1]这篇文章中，作者们提出了一种多段线性模型来解决我们刚刚说的这两个问题，这个模型简称为 LS-PLM（ Large Scale Piecewise Linear Model ）。
LS-PLM 的核心思路其实非常直观。既然数据在整个空间里可能呈现非线性的关系，那么我们是否能够把整个空间分割成较小的区域，使得每个区域内依然可以使用线性模型来逼近这个区域内的数据点呢？其实在统计学习中，这种模型常常被叫作“混合模型”。在很多机器学习教科书中都会讲授的一种混合模型是“高斯混合模型”（Gaussian Mixture Model）。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

阿里巴巴的广告点击率预估模型涉及多段线性模型、图像处理和深度学习技术。首先，通过多段线性模型（LS-PLM）解决了数据中的非线性关系和不均衡性，取得了比全局模型更好的效果。其次，结合图像处理和广告点击率预估，利用嵌入层将广告和用户信息转换成数值特征，通过多层神经网络学习点击率可能性，提高了模型性能。此外，引入了高级模型服务器（AMS）架构，将深度学习模型的基础步骤拆分并部署到不同服务器，提高了模型效率。最后，深度兴趣网络（DIN）结合了特性嵌入、池化操作和多层神经网络，提出了新的激活函数DICE，在实验中取得了显著的提高。总体而言，基于深度学习的模型比线性模型效果更好，但如何更好地利用图像信息仍是一个挑战。深度学习模型在点击率预估方面的优势在于能够处理多种来源不同的信息并学习复杂的模式，但也面临着计算量大、模型解释性差等劣势。这些技术的应用为广告点击率预估提供了新的思路和方法，对于理解和应用广告技术具有重要意义。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(2)

最新
精选

yy
深度学习优势在特征工程方面可以学习到高阶特征，还可以单模型多目标优化业务，劣势是调参门槛高
2018-06-20

1
yy
深度学习的优势是在特征工程上能省去很多人为操作，模型能学习到高阶特征，很多业务场景还可以通过深度学习来实现单模型多目标优化。劣势是模型调参数门槛高。
2018-06-20

1

收起评论