单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking

阅读量：

文章侧重

这篇文章的主要创新点在于采用Transformer架构作为特征提取增强模块。其核心原理是通过自注意力机制对Backbone网络提取出的特征进行增强，并且在这一过程中还运用了交叉注意力机制实现了Template区域与Search窗口内各区域之间信息的有效融合。这种设计不仅提升了模型在目标检测任务中的表现能力，并为后续的目标定位提供了更有力的支持

由于这篇文章只是将Transformer用于增强特征，所以在实验部分，这篇文章分别将该特征模块集成到两个Tracking pipeline中——SiamFC、DiMP，比如目标定位的方法、训练策略、超参数设定就应用这两个框架中本来的设置。
Ecoder和Decoder都只有一层，摒弃了原有Transformer的堆叠结构，且它们的自注意力机制的参数共享 ，作者认为这样的设计是为了使输入Encoder和Decoder的patch 映射到相同的特征空间，有利于交叉注意力机制的应用 而多层堆叠会将template feature和search feature映射到不同的特征空间。
摒弃了原有Transformer中的前馈神经网络。作者认为前馈神经网络的参数过多可能导致过拟合问题，而在文章的消融实验中证明去除前馈神经网络的模型在测试集上表现更好。
摒弃了原有Transformer中的多头注意力机制，只用到单头注意力。因为作者在实验中发现，增加多头机制不会显著改善效率，Head Number从1到4，测试集上AO增加0.6%，速度下降10fps。

网络结构

这里的Template实际上有20个

具体的Encoder和Decoder的结构

如下图：

模型的推理过程

孪生网络框架

该网络架构仅包含特征增强模块，在集成过程中与现有SiamFC【孪生网络框架

TrSiam：提取或剪裁Encoded Features用于构成CNN的核单元，并对其进行互相关运算（遵循SiamFC的一致性原则）。
TrDiMP：基于Encoded Features设计一种判别性更强的CNN核单元，并通过与Decoded Feature进行卷积操作生成响应图。

要QQ每天都开开心心~

全部评论 (0)

还没有任何评论哟~

单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking

目录文章侧重网络结构具体的Encoder和Decoder的结构模型的推理过程 Transformer这个香饽饽怎么能不用来迁移到目标追踪里呢。我计划对CVPR2021的3篇将Transfor...

＜Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking＞

摘要模板集在视频对象跟踪中，连续帧之间存在丰富的时间上下文，而在现有的跟踪器中却被很大程度上忽略了。在这项工作中，我们桥接单个视频帧，并通过一个用于稳固目标跟踪的Transformer架构探索跨上下...

Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

TransformerMeetsTracker:ExploitingTemporalContextforRobustVisualTracking 前言一、Abstract 二、Contributio...

CVPR 2021 Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

动机 1.视觉目标跟踪是计算机视觉中的一项基本任务。尽管最近取得了一些进展，但由于遮挡、变形、外观变化等因素的影响，它仍然是一项具有挑战性的任务。 2.在视频目标跟踪任务中，现有的跟踪器中被忽略了连续...

单目标追踪——【Transformer】Learning Spatio-Temporal Transformer for Visual Tracking

目录文章侧重网络结构 STARKS网络——仅空间建模 STARKST网络——同时对时空建模可视化和失败案例分析 Encoder的可视化 Decoder的可视化失败案例分析 Transforme...

单目标追踪——【Transformer】Autoregressive Visual Tracking

ARTrack 利用目标先前帧的预测位置，建模目标运动信息来辅助当前的目标追踪定位。原本的基于帧的追踪任务（次最优化**）变成了**序列追踪任务（最优化），这一点与目标追踪本身的定义一致。 2. 端到...

单目标追踪——【Transformer】Transformer Tracking

目录文章侧重点网络结构上下文增强模块交叉特征增强 TransT网络结构可视化结果分析 n=1 n=2 n=3 n=4 Transformer这个香饽饽怎么能不用来迁移到目标追踪里呢。本篇文...

单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking

目录文章侧重点 SequenceLevelTraining（SLT） SLTpipeline图示 SLT伪代码 SLT+TransT 论文代码文章侧重点这篇文章关注到了目标追踪的Tracker...

单目标追踪——【Transformer】SwinTrack: A Simple and Strong Baseline for Transformer Tracking

目录文章侧重点网络结构实验无motiontoken的消融实验 SwinTrack的消融实验论文链接：<https://arxiv.org/abs/2112.00995 代码链接：<https...

多目标追踪——【Transformer】Global Transformer Tracking

目录 Trackingbydetection范式文章侧重点网络结构目标关联模块——GTR 训练策略与推理逻辑论文链接：<https://arxiv.org/pdf/2203.13250.pdf...

是否确定退出登录?

单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking

目录

文章侧重

网络结构

具体的Encoder和Decoder的结构

模型的推理过程

全部评论 (0)

相关文章推荐

单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking

＜Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking＞

Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

CVPR 2021 Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking

单目标追踪——【Transformer】Learning Spatio-Temporal Transformer for Visual Tracking

单目标追踪——【Transformer】Autoregressive Visual Tracking

单目标追踪——【Transformer】Transformer Tracking

单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking

单目标追踪——【Transformer】SwinTrack: A Simple and Strong Baseline for Transformer Tracking

多目标追踪——【Transformer】Global Transformer Tracking