Advertisement

高分辨率光学遥感图像目标检测

阅读量:

目标检测在解析光学遥感图像方面具有重要意义,并可为探索利用遥感进行其他视觉任务提供理论基础。然而,在现有研究中发现,在处理光学遥感图像时,并非所有的基于目标检测的方法都充分挖掘了特征金字塔提供的深层表征信息;因此仍存在优化目标检测技术以提高精度的空间。

目前面临在目标检测效率与效果之间取得理想平衡的挑战。为此我们提出了一种新型增强型YOLOv5算法专门针对高分辨率光学遥感图像中的目标检测问题进行了优化设计该算法通过巧妙地结合多层特征金字塔结构多任务检测机制以及先进的混合注意力机制能够在有效提升目标探测精度的同时显著优化计算效率实验表明基于SIMD数据集的新算法较传统YOLOv5提升了约2.2%的平均精度较最新YOLOX版本则获得了8.48%以上的性能提升实现了在提升检测效果的同时显著缩短了处理时间

随着遥感技术的快速发展, 高分辨率光学遥感图像已被应用到地球表面的各种物体分析, 包括飞机、汽车以及建筑物等。在遥感图像解析过程中, 目标检测扮演着至关重要的角色, 它可用于遥感图像分割、特征提取以及目标追踪等操作。然而, 由于航空光学遥感图像具有较大的视场范围、高海拔位置要求以及多样化的尺度特异性、视点特异性、随机定向和高复杂背景等特点, 而现有的传统数据集主要包含地面视角图像, 因此基于卷积神经网络的目标检测算法显著优于传统方法。在社会需求与深度学习发展的推动下, 使用神经网络进行光学遥感图像中的目标检测已成为不可或缺的技术手段。

当前利用深度学习对光学遥感照片进行目标检测的方法大致可分为有监督型、半监督型以及无监督型。然而,在实际应用中发现尽管无 supervision型与弱半supervision型方法具有较高的复杂度和不稳定性特征,在工程界仍最常用的是传统的有 supervision型方法。在技术层面又可分为单阶段检测模型与双阶段检测模型。基于飞机常驻机场、船舶多驻泊于港口及海洋这一前提条件,在下采样后的遥感图像中进行机场与港口位置的定位后,并通过将识别结果反推至原始高分辨率图像空间的方式,则能够实现对不同尺寸物体的同时探测。研究者们还开发了一种基于改进RCNN框架下的旋转目标自动识别技术

现有的大多数YOLO系列检测架构主要依赖于FPN与PAFPN输出特征的设计。其中一类典型的代表是YOLOv3及其变体(下图a所示),这些架构通过单向融合机制进行信息传递。而随后发展的版本如YOLOv4与后续版本则通过引入一个从低电平到高电平信息传递的新信道来提升性能。该模块能够将基础信息向下传输至后续层(下图b)。

在一些研究中如图c所示,在某些文献中该特定检测任务新增了一个检测头以增强其识别能力

采用多个检测头的方法能够高效地提取和利用网络输出的关键特征信息。优化后的YOLO模型专为高分辨率遥感照片设计,专注于目标探测任务。如下图所示:

主干网的主要架构是以C3以及卷积操作为核心的CSP密集网。经过数据增强处理后输入图像,在核尺寸为6的Conv操作完成通道混合后,并行展开多个卷积操作提取特征信息。随后经过命名为SPPF(Scene-Paptive Pyramid Features)的特征增强模块处理后与之相连的是Neck中的PANet分支网络。通过这种双向设计有效提升了网络的整体检测性能。其中Conv2d组件负责独立缩放融合的关键特征层并生成多级输出结果如图所示在NMS算法的作用下将各单层检测器输出进行整合最终得到完整的检测结果框架

下图b描述了改进的YOLO网络每个模块的结构组成。

该模型架构主要包含四个关键组件:Conv模块、C3模块以及SPPF模块与MAB模块。其中Conv模块由2D卷积层、批量归一化(BN)层以及Silu激活函数组成;C3模块包含两个2D卷积层与一个瓶颈层;而MAB模块采用了一种加速版本的SPPF设计(SPP-Fast)。具体而言,在没有降维的前提条件下进行信道级全局平均池化操作后,在每个信道与其k个邻居之间建立关联关系的基础上应用大小为k的一维快速卷积操作以捕获各通道间的局部交互信息从而有效实现ECA功能这一过程沿着两个空间方向收集特征并生成一对方向感知特征图随后将这两个特征图连接起来并通过卷积与Sigmoid函数进行处理最终得到注意力输出结果

实验及可视化

SIMD 数据集是一种包含多类别的开源遥感对象检测数据源,并涵盖共计 15 个不同类别的实例(如图 4 所示)。其中大部分实例集中在尺寸小于 0.4 的小型目标中(w<0.4,h<0.4)。值得注意的是,在此区域所提出的改进型 YOLO 架构在该区域采用了数量翻倍的专门化探测器。由此可以看出,在此数据集中我们的改进方案展现出显著的优势。

SPPF模块的输出能够被连接至输出头以实现图像中大目标的识别功能。然而其输出端具有多条通道并分别对应不同尺寸的目标因此直接将其接入检测头会导致模型在识别大目标时表现不佳如上图所示通过对比添加前后检测结果热图可以看到引入MAB模块后检测效果得到了明显提升这使得该检测单元专精于识别大型物体而较小的目标则由其他专门的设计负责处理从而实现了模型性能与算法需求的有效结合

从实验结果来看,在图中展示了部分检测数据。通过分析这些数据集的表现特征可以看出,并没有显示出显著的优势。然而与现有的相关工作相比而言 我们的研究方法在时间资源使用方面表现出了良好的效率 并且在保持较低计算开销的前提下实现了较佳的性能水平。其中通过引入注意力机制模块 在提升模型识别能力的同时实现了信息提取效率的最大化

全部评论 (0)

还没有任何评论哟~