Advertisement

深度学习论文: EdgeYOLO: An Edge-Real-Time Object Detector及其PyTorch实现

阅读量:

Edge Real Time Object Detector and its PyTorch Implementation

1 概述

该目标检测器具有较高的精度,并且在边缘设备上实现了实时检测

  • 开发了一款 novel 的 anchor-free 目标检测框架,在边缘设备上实现了对 MS COCO2017 数据集的即时处理能力,并在平均精度(AP)方面取得了 50.6% 的优异成绩;
  • 开发出一种更具竞争力的数据增强策略,在提升训练数据规模的同时显著提升了训练数据的质量;
  • 在模型架构中采用可自适应参数重塑的结构设计方案,在测试环境下成功降低了推理时间;
  • 研发出一种新型损失函数架构,在小目标检测任务中实现了性能的优化。
在这里插入图片描述

2 EdgeYOLO

2-1 Enhanced-Mosaic & Mixup

常见的数据增强手段通常包括(a)和(b)。然而这些方法可能会导致包含无效目标的对象。此外在每个原始图像中标签数量越少的情况下出现这种情况的概率也会降低

在这里插入图片描述

作者因此提出的方法(c),

  • 首先是对多组图像采用Mosaic方法进行处理(根据每张图片所拥有的标签数量平均值的不同程度来确定分组的数量)。
    • 然后是通过Mixup方法将最后处理的一张未经复杂处理的图片与其经过Mosaic处理后的图片进行混合(其中原始图片在最终输出中的边界区域完全包含于变换后的结果边界内)。

通过方法(c),图像的丰富性得到了显著提升,并在此过程中有效降低了过拟合的风险;同时确保输出图像不仅包含足够的有效信息。

在这里插入图片描述

2-2 Lite-Decoupled Head

该方法最初应用于FCOS框架,并随后被扩展至其他无需锚框的目标检测器中。通过引入解耦结构于网络末尾几层模块,在提升回归精度的同时显著缩短了训练所需时间。值得注意的是,在现有架构中嵌入解耦头时会引入分支结构,对此问题YOLov6团队提出了一种高效的改进方案。该改进方案通过优化架构设计,在保持相同输入特征图尺寸的前提下将中间3×3卷积层的数量减少至单一的一层,并成功维持与输入特征图相同的更大数量通道数量。

在这里插入图片描述

然而这类额外的推理开销随着通道数和输入规模的扩大而显著加剧。通过引入重参化的技术不仅能够提升模型的学习能力而且还能提高推理速度

2-3 Staged Loss Function

对于目标检测,损失函数一般可以写成如下:

在这里插入图片描述

在实验中将训练过程划分为三个不同阶段进行研究与分析。
本研究主要分为两个主要研究阶段:
第一阶段主要集中在模型基础参数优化上,
通过引入混合优化策略实现了模型性能的有效提升。
第二阶段则着重于模型复杂度的提升,
从最后一个若干个Epoch的数据增强开始,
逐步引入了更为复杂的网络结构设计。

在这里插入图片描述

在该场景中,在所有图像的结果中都满足这一条件:其中p代表预测结果,t代表ground truth值,r是一个介于0和1之间的随机数

在这里插入图片描述

表明小目标精度与整体精度之间存在良好的平衡关系

3 Experiments

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~