Advertisement

SiamDW:Deeper and Wider Siamese Networks for Real-Time Visual Tracking

阅读量:

摘要

Siamese网络因其表现出色且快速,在视觉追踪领域受到广泛关注。然而由于其使用相对较为浅层(如AlexNet)的网络结构,并未能充分释放深度神经网络的优势。为此,作者致力于探索如何在提升跟踪鲁棒性和准确性的目标下平衡卷积神经网络的深度与宽度。实验结果表明直接将Siamese网络中的骨干模块替换为更深架构后并未带来跟踪效果提升。进一步分析认为:一方面大幅增大神经元感受野会减小特征判别性和定位精度;另一方面卷积操作中padding操作会减小学习准确性。针对上述问题文中提出新的残差模块以减小padding操作对其跟踪性能的影响并构建了既能适应适当感受野大小又具备合理步长设置的轻量级模型架构。实验验证表明引入该残差模块后不仅保证了追踪实时性还显著提升了追踪精度

背景

考虑到深度神经网络的强大能力,在原有Siamese网络架构中替换了较浅层的结构,并对其中的一些关键组件进行了优化设计。然而,在实际应用中发现这种改进并未带来预期的效果提升。经过深入分析后发现,在现有的设计框架下无法实现性能上的显著提升。具体而言,在这项研究中我们重点探讨了影响跟踪性能的关键因素:神经元感受野大小、步长长度以及特征填充方式。

神经元的大尺寸感受野决定了计算特征时所关注的图像区域面积较大程度上反映着周围环境的信息丰富程度;相比于小尺寸的感受野大尺寸的感受野能够更全面地捕获目标对象的关键特征;而较小尺寸的感受野则可能在细节刻画上显得略显不足难以完全精准地提取出目标对象的核心特性。(关于感受野大小及其在计算感知中的作用在深度学习领域已有诸多研究文献可作参考)

贡献

(1)系统性研究影响骨干网络跟踪准确性因素,并明确指出影响Siamese网络跟踪性能的关键要素——神经元感受野尺寸、步长设置以及特征填充特性
(2)针对这三个重要因素,在此基础上开发了一个新型的残差模块CIR单元(即内部裁剪残差单元)。该模块通过去除受padding操作影响的特征区域部分来优化特征提取质量,并通过叠加构建两种新型网络架构——更深宽度与更高分辨率的设计方案。如图所示,在合理配置步长与感受野参数后可显著提升定位精度。最终将这些深度网络整合到两个代表性Siam跟踪器中:SiamFC和SiamRPN。

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~