Advertisement

深度学习论文: YOLO-ReT: Towards High Accuracy Real-time Object Detection on Edge GPUs及其PyTorch实现

阅读量:

深度学习论文采用YOLO-ReT算法,并其实现了Real-time Object Detection on Edge GPUs的高精度及其PyTorch实现。YOLO-ReТ算法旨在实现Real-time ObjectDetectiononEdgeGPUs的高精度。PDF获取地址:https://arxiv.org/pdf/2110.13713.pdf PyТorch代码获取地址:https://github.com/shanglianlm0525/CvPytorch 另一个 PyТorch 代码获取地址:https://github.com/shanglianlm0525/PyТoric-Networks

1 概述

  • 该研究基于迁移学习框架中新的backbone设计灵感源自不同任务间的动态信息流动变化。该结构旨在增强特征交互模块的功能,并在多类边缘GPU设备上实现更高的准确性和更快的推理速度。
  • 本研究开发了一种新型的边缘GPU友好模块RFCR, 专为多尺度特征交互设计。

2 YOLO-ReT

在这里插入图片描述

2-1 Raw Feature Collection and Redistribution

将Backbone提取的多尺度特征进行融合整合,并将其均匀地分配到各个独立的尺度层级上。进而使得每个特定的比例级别的特征图能够完整地包含其他所有比例级别的细节信息。这种设计虽然避免了繁重的计算开销以及冗余参数积累的问题,但依然能够实现各比例尺度之间直接有效的信息交互。
该模块通过巧妙整合多尺度特征实现了与其他主流Backbone框架及检测器组件的良好兼容性;
其独特的设计特点在于支持与现有模块之间灵活的信息传递关系,并未对后续组件的具体接口产生任何限制性要求。

PyTorch代码:

复制代码
    
    
      
    
    代码解读

2-2 Backbone Truncation

  • 分类模型在缺乏空间信息的情况下应用于目标检测任务时可能会导致部分权重对性能产生负面影响。
    • 在迁移过程中Backbone架构中初始层的迁移学习能力起到关键作用,在迁移过程中其重要性不可忽视;
    • 而最后一层由于缺乏足够的特征提取能力,在目标检测中提供的帮助有限。
在这里插入图片描述

当提升基于经过预训练权重初始化的特征提取模块(Backbone)的比例时,在模型性能上取得了显著提升,并凸显了迁移学习的关键作用。然而,在约60%的数据量下,出现了性能下降和波动现象。这表明,在最后一层特征提取器中采用基于ImageNet迁移学习权重进行初始化相较于随机初始化而言会导致性能损失。具体原因可能在于该层特殊的任务特性使其陷入了局部极小状态。

3 Evaluations

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~