商汤科技正式开源mmdetection和mmcv
极客时间编辑部
讲述:丁婵大小:1.13M时长:02:28
近日,商汤科技正式开源 mmdetection 和 mmcv 两个项目。
据了解,mmdetection 检测库是基于商汤在 COCO 比赛(Detection 2018 winner)时的代码重构,这个开源库提供了已经公开发表的多种视觉检测核心模块,通过这些模块的组合,可以迅速搭建出各种著名的检测框架。
据该开源库作者之一、香港中文大学陈恺介绍,这一版本中实现了 RPN、Fast R-CNN、Faster R-CNN、Mask R-CNN,近期还计划释放出 RetinaNet 和 Cascade R-CNN。
另外,mmcv 是一个基础库,主要分为两个部分,一部分是和深度学习框架无关的一些工具函数,另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。
陈恺介绍, 相比 FAIR 的 Detectron,mmdetection 主要有以下三点优势:
性能稍高;
训练速度稍快;
所需要的显存稍小。
他进一步解释道,在性能上 ,由于 PyTorch 的 ResNet 结构和 Detectron 所用的 ResNet 有着细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样。他们用两种结构都进行了实验,在和 Detectron 使用相同的预训练模型的情况下,性能比 Detectron 稍微高一些。
在速度方面,Mask R-CNN 的差异比较大,其余框架的差异很小。在实验中,采用相同的配置,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。其中,Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外,他们在服务器上跑 Detectron 时,比官方运行的速度慢 20% 左右,陈恺提出猜测,这可能是 FB 的 Big Basin 服务器性能比他们好。
在显存方面,这一检测库的优势比较明显,会小 30% 左右。但是陈恺表示,这和框架有关。另外,一个让他们比较意外的结果是,在现在的代码版本上跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,显存消耗比他们在 COCO 比赛时小了不少。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论