096 | 如何利用机器学习技术来检测广告欺诈？

洪亮劼



该思维导图由 AI 生成，仅供参考

在上一期的内容中，我们聊了如何帮助广告商扩大受众群这个话题，也就是受众扩展技术。受众扩展的目的是让广告商投放的广告能够接触到更广泛的受众，甚至有可能提高广告效果。
在计算广告高级话题的最后一篇分享，同时也是整个广告模块的最后一篇分享里，我想来聊一聊广告中一个非常棘手，同时也是一个非常实际的问题：欺诈检测（Fraud Detection）。
什么是广告欺诈广告欺诈是一个多大规模的问题呢？
根据一个统计数字[1]，到 2015 年的时候，就因为广告欺诈，全美的市场营销和媒体业每年的耗费约为 82 亿美元。这个数字中大约有 56%，也就是 46 亿多美元的耗费来自于“非法流量”（Invalid Traffic）。我们把这个数字和全美每年 596 亿的广告支出进行对比，就可以看出这是一个惊人的数字。当然，因为各种欺诈手段层出不穷，并不是所有的欺诈都能够被甄别出来。因此，我们其实有理由相信真实的数字会更高。
那么，怎么来定义广告欺诈呢？什么样的行为算是广告欺诈呢？
我们这里主要讨论三种形式的广告欺诈。这三种广告欺诈模式其实对应着三种流行的广告计费模式。
第一种欺诈叫“展示欺诈”（Impression Fraud），也就是造假者产生虚假的竞价信息，然后把这些竞价展示放到广告交易平台上去贩卖，并且在广告商购买了这些展示后获利。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

利用机器学习技术来检测广告欺诈是一个重要的技术挑战。广告欺诈是一个严重的问题，据统计，由于广告欺诈，全美市场营销和媒体业每年的耗费约为82亿美元。欺诈形式包括展示欺诈、点击欺诈和转化欺诈，而欺诈的产生源头包括PPV网络、僵尸网络和竞争对手攻击。为了应对这些欺诈行为，研究者们提出了多种方法，如利用“同访问”图来分析异常的浏览行为、分析用户浏览显示像素的时间以检测展示欺诈，以及将欺诈检测作为监督学习任务来进行学习。然而，欺诈检测面临着数据不足、训练和不平衡的分类问题等挑战，因此仍然是一个前沿的研究领域。本文总结了广告欺诈的形式、产生源头以及利用机器学习技术进行欺诈检测的基本思路，为读者提供了对该领域的深入了解和思考。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《AI 技术内参》，新⼈⾸单¥98

立即购买

登录后留言

全部留言(1)

最新
精选

范深
“如何来检测转化欺诈，也就是我们怎么知道广告转化中哪些是虚假的呢？”可以考虑关注转化后链路的留存动作，找到区别于正常用户的行为（比如停留时间、次日回访与否）从而挖掘出潜在欺诈的特征，比如运营商、电话区域
2020-10-31

1

收起评论