深度学习计算机视觉极限将至,该如何突破?
极客时间编辑部
讲述:丁婵大小:2.73M时长:02:59
深度学习是近年来人工智能技术发展的核心,虽然取得了巨大成功,但它具有明显的局限性。本文中,来自约翰霍普金斯大学的学者们介绍了深度学习的几大极限,以及如何解决这些问题的思路。
研究人员表示,目前形式的深度神经网络似乎不太可能是未来建立通用智能机器,或理解思维 / 人类大脑的最佳解决方案,但深度学习的很多机制在未来仍然会继续存在。
尽管深度学习超越了此前的一些技术,但是它们却并不能用于通用任务。在这里,我们可以定义出三个主要限制。
首先,深度学习几乎总是需要大量标注数据。这使得计算机视觉的研究者们倾向于解决易于解决,而不是真正重要的问题。
第二,深度学习在基准测试数据集上表现良好,但在数据集之外的真实世界图像上可能表现很差。所有数据集都有自己的偏差,这种偏差在早期视觉数据集中非常明显。
第三,深度网络对图像的改变过于敏感,而这些改变在人类看来可能并不影响对图的判断。深度网络不仅对标准对抗攻击敏感,而且对环境的变化也过于敏感。
尽管人类能够自然地适应视觉环境中的种种变化,但深度神经网络更加敏感、易错,虽然深度神经网络在医学图像中的应用通常非常成功。但是对于许多应用来说,如果没有一个指数级的大型数据集,我们就无法捕捉到现实世界的复杂性。
这一缺陷带来了一些重大问题,因为在有限随机样本上进行训练、测试模型这一标准范式变得不切实际。这些样本量永远无法大到可以表征数据底层分布的程度。
对此,一种潜在的解决方案是组合性,组合性是一种基本原则。组合性模型的若干概念优势已经体现在一些视觉问题中,如使用相同的底层模型执行多个任务和识别验证码。其它非视觉示例也表明了相同的论点。对于一些自然语言应用,神经模块网络的动态架构似乎足够灵活,可以捕捉到一些有意义的组合,其性能优于传统的深度学习网络。
据了解,组合性模型有很多理想的理论特性,如可解释、可生成样本。这使得错误更容易诊断,因此它们比深度网络等黑箱方法更难被欺骗。
值得一提的是,学习组合性模型很难,因为它需要学习构件和语法(甚至语法的性质也是有争议的)。并且,为了通过合成进行分析,它们需要拥有目标和场景结构的生成模型。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论