08 防止垃圾邮件的一种方法
[美] 保罗•格雷厄姆
我认为过滤垃圾邮件是可以做到的,基于内容的过滤器将发挥作用。发送垃圾邮件的人有一个致命伤,那就是他们发送的邮件本身。他们有办法逃脱你搭建的其他壁垒(至少目前是这样),但是不管怎样,他们都必须把垃圾邮件发出去。如果我们能够写出可以从内容上识别出垃圾邮件的软件,那么他们就无法逃脱了。
收件人很容易识别哪些是垃圾邮件,哪些是正常邮件。如果你雇人用肉眼帮你清除垃圾邮件,这事情应该没有太大难度。那么我们怎么用软件自动模拟这个过程(假定不使用复杂的人工智能)?
我觉得只用一些很简单的算法就可以做到这一点。事实上,我发现只要对单个词语进行贝叶斯推断,就能很好地过滤大部分垃圾邮件。设置好贝叶斯过滤器(详见后文),1 000 封垃圾邮件能够被过滤掉 995 封,并且没有一个误判。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
本文深入探讨了基于内容的垃圾邮件过滤技术,重点介绍了贝叶斯推断算法的应用。作者指出了使用统计学方法过滤垃圾邮件的优点,避免了繁琐的逐封查看工作,并强调了过滤器的误判问题。文章还提到了贝叶斯方法计算概率的优势,以及如何根据个人邮件库开发个性化的垃圾邮件过滤器。此外,作者还讨论了白名单的建立以及贝叶斯过滤器的进化能力。文章还探讨了垃圾邮件业的商业模式和成本,以及对抗垃圾邮件的方法。作者认为,贝叶斯过滤是最有效的工具,但综合使用多种方法效果更佳。总的来说,本文为读者提供了深入的垃圾邮件过滤技术发展和应用的有益信息。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《黑客与画家》
《黑客与画家》
立即购买
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论