模型库和基线

测试环境

Python 3.7
PaddlePaddle 每日版本
CUDA 10.1
cuDNN 7.5
NCCL 2.4.8

通用设置

所有模型均在COCO17数据集中训练和测试。
除非特殊说明，所有ResNet骨干网络采用ResNet-B结构。
推理时间(fps): 推理时间是在一张Tesla V100的GPU上通过'tools/eval.py'测试所有验证集得到，单位是fps(图片数/秒), cuDNN版本是7.5，包括数据加载、网络前向执行和后处理, batch size是1。

训练策略

我们采用和Detectron相同的训练策略。
1x 策略表示：在总batch size为8时，初始学习率为0.01，在8 epoch和11 epoch后学习率分别下降10倍，最终训练12 epoch。
2x 策略为1x策略的两倍，同时学习率调整位置也为1x的两倍。

ImageNet预训练模型

Paddle提供基于ImageNet的骨架网络预训练模型。所有预训练模型均通过标准的Imagenet-1k数据集训练得到，ResNet和MobileNet等是采用余弦学习率调整策略或SSLD知识蒸馏训练得到的高精度预训练模型，可在PaddleClas查看模型细节。

基线

Faster R-CNN

请参考Faster R-CNN

Mask R-CNN

请参考Mask R-CNN

Cascade R-CNN

请参考Cascade R-CNN

YOLOv3

请参考YOLOv3

SSD

请参考SSD

FCOS

请参考FCOS

SOLOv2

请参考SOLOv2

PP-YOLO

请参考PP-YOLO

TTFNet

请参考TTFNet

Group Normalization

请参考Group Normalization

Deformable ConvNets v2

请参考Deformable ConvNets v2

HRNets

请参考HRNets

Res2Net

请参考Res2Net

GFL

请参考GFL

PicoDet

请参考PicoDet

PP-YOLOE/PP-YOLOE+

请参考PP-YOLOE

YOLOX

请参考YOLOX

YOLOv5

请参考YOLOv5

YOLOv6

请参考YOLOv6

YOLOv7

请参考YOLOv7

旋转框检测

旋转框检测模型库

关键点检测

PP-TinyPose

请参考PP-TinyPose

HRNet

请参考HRNet

HigherHRNet

请参考HigherHRNet

多目标跟踪

DeepSORT

请参考DeepSORT

JDE

请参考JDE

FairMOT

请参考FairMOT

ByteTrack

请参考ByteTrack

OC-SORT

请参考OC-SORT