122 | 计算机视觉领域的深度学习模型(二):VGG & GoogleNet
洪亮劼
该思维导图由 AI 生成,仅供参考
在上第一期的分享中,我们通过一篇经典论文讲了 AlexNet 这个模型。可以说,这篇文章是深度学习在计算机视觉领域发挥作用的奠基之作。
AlexNet 在 2012 年发表之后,研究界对这个模型做了很多改进工作,使得这个模型得到了不断优化,特别是在 ImageNet 上的表现获得了显著提升。今天我们就来看看针对 AlexNet 模型的两个重要改进,分别是 VGG 和 GoogleNet。
VGG 网络
我们要分享的第一篇论文题目是《用于大规模图像识别的深度卷积网络》(Very Deep Convolutional Networks for Large-Scale Image Recognition)[1]。这篇文章的作者都来自于英国牛津大学的“视觉几何实验室”(Visual Geometry Group),简称 VGG,所以文章提出的模型也被叫作 VGG 网络。到目前为止,这篇论文的引用次数已经多达 1 万 4 千次。
首先,我们简单来了解一下这篇论文的作者。
第一作者叫卡伦·西蒙彦(Karen Simonyan),发表论文的时候他在牛津大学计算机系攻读博士学位。之后,西蒙彦加入了谷歌,在 DeepMind 任职,继续从事深度学习的研究。
第二作者叫安德鲁·兹泽曼(Andrew Zisserman),是牛津大学计算机系的教授,也是计算机视觉领域的学术权威。他曾经三次被授予计算机视觉最高荣誉“马尔奖”(Marr Prize)。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
两篇论文《用于大规模图像识别的深度卷积网络》和《更深层的卷积》分别介绍了VGG和GoogleNet模型对AlexNet的优化改进。VGG模型通过改变卷积层的过滤器,实现了19层的深层网络结构,显著降低了ImageNet上的错误率。而GoogleNet模型则在网络架构上进行创新,利用稀疏化结构实现更深的网络架构,并在计算效率上表现出色。其中,GoogleNet的Inception模块采用局部紧密结构来逼近理想的稀疏化结构,使得整个网络超过100层。这两个模型的优化改进展示了深度模型研发的趋势,即不断探索更深层次、更高效率的网络架构。这些改进为深度学习在计算机视觉领域的发展提供了重要的思路和方法。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》,新⼈⾸单¥98
《AI 技术内参》,新⼈⾸单¥98
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(5)
- 最新
- 精选
- sky第一是如何让网络越来越深,参数越来越多,第二是如何优化网络结构,优化网络结构需要对深度神经网络有更基础的理论性理解2018-09-113
- 吴文敏更深的模型更少的参数2018-09-261
- 皮特尔VGG:第一个真正意义上达到“深层”的网络架构; GoogleNet:优化网络架构。2020-06-05
- sky第一是如何让网络越来越深,参数越来越多,第二是如何优化网络结构,优化网络结构需要对深度神经网络有更基础的理论性理解2018-09-11
- Andy请问老师计算机视觉会被这些复杂的模型统治吗?2018-09-10
收起评论