YOLOv3增强模型¶

简介¶

YOLOv3 是由 Joseph Redmon 和 Ali Farhadi 提出的单阶段检测器, 该检测器与达到同样精度的传统目标检测方法相比，推断速度能达到接近两倍.

PaddleDetection实现版本中使用了 Bag of Freebies for Training Object Detection Neural Networks 中提出的图像增强和label smooth等优化方法，精度优于darknet框架的实现版本，在COCO-2017数据集上，YOLOv3(DarkNet)达到mAP(0.50:0.95)= 38.9的精度，比darknet实现版本的精度(33.0)要高5.9。同时，在推断速度方面，基于Paddle预测库的加速方法，推断速度比darknet高30%。

在此基础上，PaddleDetection对YOLOv3进一步改进，进一步提升了速度和精度，最终在COCO mAP上可以达到43.2。

方法描述¶

1.将YOLOv3骨架网络更换为ResNet50-VD。ResNet50-VD网络相比原生的DarkNet53网络在速度和精度上都有一定的优势，且相较DarkNet53 ResNet系列更容易扩展，针对自己业务场景可以选择ResNet18、34、101等不同结构作为检测模型的主干网络。

2.引入Deformable Convolution v2(可变形卷积)替代原始卷积操作，Deformable Convolution已经在多个视觉任务中广泛验证过其效果，在Yolo v3增强模型中考虑到速度与精度的平衡，我们仅使用Deformable Convolution替换了主干网络中Stage5部分的3x3卷积。

3.在FPN部分增加DropBlock模块，提高模型泛化能力。Dropout操作如下图（b）中所示是分类网络中广泛使用的增强模型泛化能力的重要手段之一。DropBlock算法相比于Dropout算法，在Drop特征的时候会集中Drop掉某一块区域，更适应于在检测任务中提高网络泛化能力。

../_images/dropblock.png image-20200204141739840

4.Yolo v3作为一阶段检测网络，在定位精度上相比Faster RCNN，Cascade RCNN等网络结构有着其天然的劣势，增加IoU Loss分支，可以一定程度上提高BBox定位精度，缩小一阶段和两阶段检测网络的差距。

5.增加IoU Aware分支，预测输出BBox和真实BBox的IoU，修正用于NMS的评分，可进一步提高YOLOV3的预测性能。

6.使用Object365数据集训练得到的模型作为coco数据集上的预训练模型，Object365数据集包含约60万张图片以及365种类别，相比coco数据集进行预训练可以进一步提高YOLOv3的精度。

使用方法¶

模型训练¶

export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python tools/train.py -c configs/dcn/yolov3_r50vd_dcn_db_iouloss_obj365_pretrained_coco.yml

更多模型参数请使用python tools/train.py --help查看，或参考训练、评估及参数说明文档

模型效果¶

模型	预训练模型	验证集 mAP	V100 python 预测速度（FPS）¹	V100 paddle预测库速度（ms/image）²	P4 paddle预测库速度(ms/image) ²	下载	配置文件
YOLOv3 DarkNet	DarkNet pretrain	38.9	48.55	原生：19.63 tensorRT-FP32: 18.01 tensorRT-FP16: 11.47	原生：54.10 tensorRT-FP32: 47.44	下载链接	配置文件
YOLOv3 ResNet50_vd DCN	ImageNet pretrain	39.1	50.80	原生：17.04 tensorRT-FP32: 16.28 tensorRT-FP16: 11.16	原生：40.01 tensorRT-FP32: 36.66	下载链接	配置文件
YOLOv3 ResNet50_vd DCN	Object365 pretrain	42.5	50.41	原生：16.76 tensorRT-FP32: 16.04 tensorRT-FP16: 10.70	原生：39.64 tensorRT-FP32: 35.93	下载链接	配置文件
YOLOv3 ResNet50_vd DCN DropBlock	Object365 pretrain	42.8	49.97	原生：16.55 tensorRT-FP32: 16.07 tensorRT-FP16: 10.69	原生：39.72 tensorRT-FP32: 35.98	下载链接	配置文件
YOLOv3 ResNet50_vd DCN DropBlock IoULoss	Object365 pretrain	43.2	49.91	原生：16.46 tensorRT-FP32: 15.83 tensorRT-FP16: 10.80	原生：39.58 tensorRT-FP32: 35.61	下载链接	配置文件
YOLOv3 ResNet50_vd DCN DropBlock IoU-Aware	Object365 pretrain	43.6	48.19	原生：17.74 tensorRT-FP32: 16.73 tensorRT-FP16: 11.74	原生：41.39 tensorRT-FP32: 37.75	下载链接	配置文件

[1]V100 python 预测速度是在一张Tesla V100的GPU上通过tools/eval.py测试所有验证集得到，单位是fps(图片数/秒), cuDNN版本是7.5，包括数据加载、网络前向执行和后处理, batch size是1。

[2]paddle预测库测试时，输入图片大小为640x640；去掉前10轮warmup时间，测试100轮的平均时间; 开启了参数FLAGS_cudnn_exhaustive_search=True；使用代码deploy/python/infer.py测试