项目 | 超强PyTorch目标检测库Detectron2,FaceBook出品


栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI

PyTorch目标检测库 Detectron2 诞生了,Facebook出品。站在初代的肩膀上,它训练比从前更快,功能比从前更全,支持的模型也比从前更丰盛。至今,已在GitHub收获6000+星。


除此之外,团队把大规模姿态估计算法DensePose,做出了基于Detectron2的新版本,可以把它当成一个广泛支持各种研究工作的库了。
Detectron2发生了哪些进化:

全方位升级

首先,Detectron2比起初代,最明显的变化是:
  • 基于PyTorch了,初代还是在Caffe2里实现的。Detectron2是在PyTorch里从零开始写成的,团队希望这种做法,能让用户享受PyTorch做深度学习的思路。社区更活跃的话,PyTorch也会变得更好。

第二个变化,是模块化了。
所谓模块化,就是用户可以把自己定制的模块实现,加到一个目标检测系统的任何部分里去。这意味着许多的新研究,都能用几百行代码写成,并且可以把新实现的部分,跟核心Detectron2库完全分开。
除此之外,还有许多新支持的模型、功能和任务:
新模型&新功能
首先,Detectron2包含了一代可用的所有模型:
比如Faster R-CNN,Mask R-CNN,RetinaNet,DensePose等等。


然后,加入了一些新模型:
比如Cascade R-NN,Panoptic FPN,以及TensorMask。
新任务
和目标检测有关的任务,初代已经支持了一部分,二代也都支持:
有边界框的目标检测,实例分割mask,以及人类姿态预测。


在这基础之上,二代又增加了新任务:
语义分割和全景分割 (Panoptic Segmentation) ,这是一个把语义分割和实例分割结合到一起的任务。速度快
博客提到,由于把整个训练pipeline移到了GPU上,二代比初代更快了,在许多模型上都是如此。分布式训练,让几台GPU一起跑的话,还可以把训练规模扩张到更大的数据集上。
速度的对比,是用第100-500次迭代之间的平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下:
肉眼可见的加速。
部署一下
Facebook的计算机视觉攻城狮们,实现了一个额外的软件层,叫Detectron2go。
有了它,就可以更快地把新实现的模型,部署到生产环节。这一层的功能包括了标准训练工作流,带有内部数据集,网络量化,以及模型转化 (为了给云端和移动端部署,选择各自最优的格式) 。

传送门

GitHub项目:
https://github.com/facebookresearch/detectron2
Facebook博客传送门:
https://ai.facebook.com/blog/-detectron2-a-pytorch-based-modular-object-detection-library-/
推荐阅读
封装了一些 python 爬虫技巧,开箱即用
GitHub万星热榜 | 这个用Python做交互式图形的项目火爆了
不一样的 NumPy教程,数值处理可视化
IT 开发利器,10 个 MacOS 很赞的开源小工具
资料 | 线性代数不在枯燥,可视化交互式学习笔记