Facebook开源深度学习库Detectron
极客时间编辑部
讲述:丁婵大小:1.41M时长:03:05
在谷歌更新了 TensorFlow 图像识别 API 之后,Facebook 宣布开源其目标检测库 Detectron。这两个库都提供了最新的深度学习目标检测算法。
据介绍,Detectron 是基于 Facebook 的深度学习框架 Caffe2 开发的,使用了开源协议 Apache 2.0,可以直接作为 Python 的库使用。而谷歌的 TensorFlow 图像识别 API 最早于 2017 年 6 月发布,是 TensorFlow 研究项目的一部分,TensorFlow 总共包含了约 40 个不同的深度学习项目。
目前,这两个库中包含的预训练模型都已经在 COCO 数据集上进行了训练,这是一个大型对象检测、分割和字幕数据集,其中包括 80 个对象类别、超过 20 万张标注图像以及 150 万个实例对象。
不过,Facebook 的 Detectron 和谷歌的 Tensorflow 图像识别 API 都主要用于研究,目前还没有投入生产。
目标检测是计算机视觉领域中具有挑战性的一个方面,在许多计算机视觉领域的任务上都有应用,包括从简单的人脸检测到图像检索和视频监控。具体应用上,自动驾驶需要依赖于实时行人检测技术,而城市的车辆与人口数量的自动统计在城市规划中也很有价值。
当前,目标检测面临的主要问题,在于自然场景下,未知目标的数量、大小和在图像上的分布都是随机的。并且在提升精度的同时,人们还要求算法具有速度优势,这也增加了任务本身的难度。
在机器学习中,静止图像中的目标检测需要同时解决两个问题,即确定图像的某个特定区域、某个目标物体并判断其种类。目前,目标检测模型建立在卷积神经网络 CNN 的基础上,而 CNN 使用矩形滑动窗口对整个原始图像进行特征提取。
据了解,目标检测算法主要有两大类:
基于 R-CNN 的方法使用多尺度滑动窗口,来处理不同尺寸的目标;
YOLO(You Only Look Once)算法使用不同的特征提取和决策方法,对图像进行一次推理。
虽然早期的工作能够在目标物体的周围标记一个矩形边界(object localization),但是最近的一些研究成果,例如 Mask R-CNN 和 RetinaNet,能够在物体边缘标记出更精确的边界。这一重大的进展被称为实例分割(instance segmentation),对于图像中的每个像素点,都会确定其对于某一特定类的归属关系。
最后 ,有评论称,Tensorflow 目标检测 API 更容易训练,它的 GitHub 库中包括一些可以用于安装、训练模型和迁移学习的 Jupyter Notebooks,在谷歌的目标检测库中也可以获取更多的在线教程。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论