项目 | 超强PyTorch目标检测库Detectron2，FaceBook出品

栗子发自凹非寺

量子位报道 | 公众号 QbitAI

PyTorch目标检测库 Detectron2 诞生了，Facebook出品。站在初代的肩膀上，它训练比从前更快，功能比从前更全，支持的模型也比从前更丰盛。至今，已在GitHub收获6000+星。

除此之外，团队把大规模姿态估计算法DensePose，做出了基于Detectron2的新版本，可以把它当成一个广泛支持各种研究工作的库了。

Detectron2发生了哪些进化：

全方位升级

首先，Detectron2比起初代，最明显的变化是：

基于PyTorch了，初代还是在Caffe2里实现的。Detectron2是在PyTorch里从零开始写成的，团队希望这种做法，能让用户享受PyTorch做深度学习的思路。社区更活跃的话，PyTorch也会变得更好。

第二个变化，是模块化了。

所谓模块化，就是用户可以把自己定制的模块实现，加到一个目标检测系统的任何部分里去。这意味着许多的新研究，都能用几百行代码写成，并且可以把新实现的部分，跟核心Detectron2库完全分开。

除此之外，还有许多新支持的模型、功能和任务：

新模型&新功能

首先，Detectron2包含了一代可用的所有模型：

比如Faster R-CNN，Mask R-CNN，RetinaNet，DensePose等等。

然后，加入了一些新模型：

比如Cascade R-NN，Panoptic FPN，以及TensorMask。

新任务

和目标检测有关的任务，初代已经支持了一部分，二代也都支持：

有边界框的目标检测，实例分割mask，以及人类姿态预测。

在这基础之上，二代又增加了新任务：

语义分割和全景分割 (Panoptic Segmentation) ，这是一个把语义分割和实例分割结合到一起的任务。速度快

博客提到，由于把整个训练pipeline移到了GPU上，二代比初代更快了，在许多模型上都是如此。分布式训练，让几台GPU一起跑的话，还可以把训练规模扩张到更大的数据集上。

速度的对比，是用第100-500次迭代之间的平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下：

肉眼可见的加速。

部署一下

Facebook的计算机视觉攻城狮们，实现了一个额外的软件层，叫Detectron2go。

有了它，就可以更快地把新实现的模型，部署到生产环节。这一层的功能包括了标准训练工作流，带有内部数据集，网络量化，以及模型转化 (为了给云端和移动端部署，选择各自最优的格式) 。

GitHub项目：

https://github.com/facebookresearch/detectron2

Facebook博客传送门：

https://ai.facebook.com/blog/-detectron2-a-pytorch-based-modular-object-detection-library-/

推荐阅读

封装了一些 python 爬虫技巧，开箱即用

GitHub万星热榜 | 这个用Python做交互式图形的项目火爆了

不一样的 NumPy教程，数值处理可视化

IT 开发利器，10 个 MacOS 很赞的开源小工具

资料 | 线性代数不在枯燥，可视化交互式学习笔记