Advertisement

目标检测总结

阅读量:
任务

常规的目标检测任务涉及不同尺寸的目标识别。本研究提出的方法专注于小尺寸目标的识别,并适用于以下应用场景:地铁站和火车站的人体探测、遥感影像中的小目标识别以及卫星图像的小物体探测。

YOLO架构
创新点:
  • 移除了原始YOLO框架的全连接层,使用了全卷积的方式,删除了(7 7 1024)4096(7 7 30)的最后两个全连接层,参数只有原始YOLO的10%,取而代之的是使用kernel=3 3 stride=2 padding=1的卷积下采样得到N 5 H W大小的特征图作为预测结果,其中5通道,各个通道表示(class, bbox左上角x坐标,bbox左上角y坐标,bbox右下角x坐标,bbox右下角y坐标)
  • 采用适应性高分辨率训练(adaptive high resolution training method):因为是全卷积网络没有全连接层,所以对输入尺寸的不敏感的。先采用低分辨率训练7000batch,batch size=16,在使用原始分辨率训练2000batch
  • 多尺度训练:给定一个最小分辨率和一个最大分辨率,图片随机裁剪到该范围大小,提高模型的泛化性能。
  • 两种训练策略提升2个mAP的百分点,COCO数据集在25ms/image的速度下达到0.35mAP。
  • 提出新的优化策略:融合了AdaGrade+Momentum新的优化策略,训练效率不如Adam但效果优于Adam。
  • 解决模型训练过慢问题:使用Nvidia dali解决CPU瓶颈,Automatic Mixed Precision解决GPU瓶颈、内存盘解决数据IO瓶颈。
改进后的YOLO架构
环境配置
改进后YOLO密集检测效果实例

全部评论 (0)

还没有任何评论哟~