单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking

阅读量：

研究重点聚焦于序列级别训练（SLT）方法及其在实际应用中的表现。
具体而言：
- 序列级别训练（SLT）方法通过构建完整的训练体系实现了性能显著提升。
- SLT pipeline图示详细展示了各组件之间的交互关系。
- SLT 伪代码片段清晰呈现了算法的具体实现逻辑。
- 结合TransT的序列级别训练方法进一步提升了模型的迁移能力。

论文
 代码

文章侧重点

本文聚焦于目标追踪中的Tracker训练机制。

Sequence-Level Training（SLT）

SLT pipeline图示

平均IOU

输入： 以 Original Video 为基础建立的训练序列。
第一步：数据增强。 从 Original Video 中随机抽取帧序列，并将其视为一个包含 $T+1$ 帧的训练事件（ Episode ），该事件被分别输入至共享参数化的 Sampling tracker 和 Argmax Tracker。
第二步： 基于目标位置为中心的概率分布 $p_\theta$ 进行操作，在这里 $l_{t-1}$ 表示第 $t-1$ 帧的预测结果，而 $v_t$ 表示第 $t$ 帧的内容。\n\n其中,Sampling tracker 随机选取可能的目标边界框,Argmax Tracker 则会选择具有最高置信度的一个边界框进行预测。\n\n $r(l)$ 表示对当前帧预测边界框与 GroundTruth 的评估结果。
输出： 图表中可见, 对应的Reward $r(l)$ 是对上述训练事件（ Episode ) 中使用_Sampling tracker_ 进行预测所得边界框与GroundTruth 的评估得分, 其平均IOU值为75.5分；而使用_Argmax Tracker_ 所得的结果评分为56.7分。

这里的框架让我想起，这就像目标追踪的某些Tracker会有一些后置操作——窗口惩罚、余弦窗口，就是因为在一帧中目标的移动不会很大，所以一般认为如果预测边界框比上一帧偏移太多，就认为识别错了，可能跳到另一个相似的目标上了，然后就对这种移动过大的目标给予小权重，使得最后这种边界框得分低。
这里的Sampling Tracker本身的操作也是在上一帧的目标位置附近随机采样一个边界框作为预测目标结果，虽然说随机，但是采样是服从概率函数的。所以 Argmax Tracker 就是凭特征找到置信度最高的边界框，然后 Sampling tracker 限制框偏移。
这里很明显训练的参数是这个概率函数的参数。

SLT 伪代码

这个伪代码相当于上图所示的pipeline流程。其中 $L$ 即表示训练概率函数的loss function。

SLT+TransT

Transformer

全部评论 (0)

还没有任何评论哟~

单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking

目录文章侧重点 SequenceLevelTraining（SLT） SLTpipeline图示 SLT伪代码 SLT+TransT 论文代码文章侧重点这篇文章关注到了目标追踪的Tracker...

单目标追踪——【Transformer】Learning Spatio-Temporal Transformer for Visual Tracking

目录文章侧重网络结构 STARKS网络——仅空间建模 STARKST网络——同时对时空建模可视化和失败案例分析 Encoder的可视化 Decoder的可视化失败案例分析 Transforme...

单目标追踪——【Transformer】Autoregressive Visual Tracking

ARTrack 利用目标先前帧的预测位置，建模目标运动信息来辅助当前的目标追踪定位。原本的基于帧的追踪任务（次最优化**）变成了**序列追踪任务（最优化），这一点与目标追踪本身的定义一致。 2. 端到...

单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking

目录文章侧重网络结构具体的Encoder和Decoder的结构模型的推理过程 Transformer这个香饽饽怎么能不用来迁移到目标追踪里呢。我计划对CVPR2021的3篇将Transfor...

单目标追踪——【Transformer】Transformer Tracking

目录文章侧重点网络结构上下文增强模块交叉特征增强 TransT网络结构可视化结果分析 n=1 n=2 n=3 n=4 Transformer这个香饽饽怎么能不用来迁移到目标追踪里呢。本篇文...

单目标追踪——【Transformer】SwinTrack: A Simple and Strong Baseline for Transformer Tracking

目录文章侧重点网络结构实验无motiontoken的消融实验 SwinTrack的消融实验论文链接：<https://arxiv.org/abs/2112.00995 代码链接：<https...

多目标追踪——【Transformer】Global Transformer Tracking

目录 Trackingbydetection范式文章侧重点网络结构目标关联模块——GTR 训练策略与推理逻辑论文链接：<https://arxiv.org/pdf/2203.13250.pdf...

单目标追踪——【Transformer】MixFormer: End-to-End Tracking with Iterative Mixed Attention

目录文章侧重点网络结构 MAM——MixedAttentionModule MixFormer 论文代码文章侧重点本文的出发点是认为现有的多阶段Siamese追踪框架【特征提取特征融合边界框...

论文笔记：目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

基于自适应颜色属性的目标追踪 AdaptiveColorAttributesforRealTimeVisualTracking 基于自适应颜色属性的实时视觉追踪 3月讲的第一篇论文，个人理解，存在很多...

多目标追踪——【Transformer】MOTR: End-to-End Multiple-Object Tracking with TRansformer

目录文章侧重点将ObjectQuery变成TrackQuery需要解决的问题总体网络结构——时序融合网络 QIM——Query交互模块训练逻辑 TrackletAwareLabelAssign...

是否确定退出登录?

单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking

目录

文章侧重点

Sequence-Level Training（SLT）

SLT pipeline图示

SLT 伪代码

SLT+TransT

全部评论 (0)

相关文章推荐

单目标追踪——【Transformer】ECCV2022-Towards Sequence-Level Training for Visual Tracking

单目标追踪——【Transformer】Learning Spatio-Temporal Transformer for Visual Tracking

单目标追踪——【Transformer】Autoregressive Visual Tracking

单目标追踪——【Transformer】Transformer Meets Tracker:Exploiting Temporal Context for Robust Visual Tracking

单目标追踪——【Transformer】Transformer Tracking

单目标追踪——【Transformer】SwinTrack: A Simple and Strong Baseline for Transformer Tracking

多目标追踪——【Transformer】Global Transformer Tracking

单目标追踪——【Transformer】MixFormer: End-to-End Tracking with Iterative Mixed Attention

论文笔记：目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

多目标追踪——【Transformer】MOTR: End-to-End Multiple-Object Tracking with TRansformer