算法学习 -- Staple: Complementary Learners for Real-Time Tracking

阅读量：

Abstract

一个结合梯度特征HOG及颜色特征的实时跟踪算法，速度达到80FPS，即每秒80帧图像。

Introduction

Staple: Sum of Template And Pixel-wise LEarners
对于目前的主流跟踪算法，采用的tracking-by-detection策略，即先检测目标的位置，以HOG检测为例，对同一个目标，可能得到多个目标的矩形框，如下图所示。有的时候直接通过NMS(non-maximum suppression 非极大值抑制)处理保证只有一个解。不过多数跟踪算法宁可错杀，也不愿放过一个。HOG Object Detection 可以参考 Histogram of Oriented Gradients and Object Detection
在这里插入图片描述

Online learning and Correlation Filters：在线学习+协同过滤
Robustness to deformation：应对形变
Schemes to reduce model drift：应对漂移问题
Combining multiple estimates：结合多种估计
Long-term tracking with re-detection：长期跟踪及重复检测

Proposed Approach

符号及含义

$t$ frame index, 帧索引，帧下标
$x_t$ 第t帧图像， $x$ 指代任意一帧图像
$p_t$ 第t帧图像中目标对应的矩形，当然，这个是最优的， $p$ 指代任意一帧图像
$S_t$ 第t帧图像中目标对应的所有矩形，所以我们有 $p_t=argmax_{p\in S_t}f(T(x_t,p);\theta _{t-1})$
$f(T(x,p);\theta)$ 依据模型参数 $\theta$ ，计算得到目标在图像 $x$ 对应矩形 $p$ 的分数(score)。这个分数当然是越高越好，所以选择取最大分数时的矩形 $p$ 作为最优的矩形 $p_t$ 。对于 $T(x,p)$ 可以暂时肤浅地理解为检测出来的梯度特征与颜色特征。同样参数 $\theta$ 也可以暂时肤浅地理解为预测的梯度特征与颜色特征。然后 $f(T(x,p);\theta)$ 求预测特征与检测特征之间的匹配的情况，匹配分数越高，就越可能对应实际的目标矩形 $p_t$ 。
$\theta$ 模型参数 $\theta$ 可以通过损失最小化求出，设损失函数为 $L(\theta;X_t)$ ,在这里 $X_t=\{(x_i,p_i\}_{i=1}^t$ 并不是帧的集合 $\{x_1,x_2,...,x_t\}$ ，而是 $\{(x_1,p_1),(x_2,p_2),...,(x_t,p_t)\}$ ，这样包含之前每一帧中目标的位置。对参数的复杂度加以惩罚，最终得到： $\theta _t=argmin_{\theta \in \Omega} \{L(\theta;X_t)+\lambda R(\theta)\}$
$f(x)$ 回到对 $p$ 进行打分的函数，前面提到要结合梯度特征与颜色特征，考虑算法的实时性，当然用线性方式结合速度快，这样有 $f(x)=c_{tmpl}f_{tmpl}(x)+c_{hist}f_{hist}(x)$
抱歉这里的 $x$ 理应对应 $T(x,p);\theta$ ，但原文中就是这么用的。tmpl 就是template(梯度特征)，hist就是histogram(颜色直方图特征)
$f_{tmpl}(x;h)$ 考虑梯度特征的打分函数，这里 $\mathcal{T}$ 与 $T$ 以及前面的函数 $T(x_t,p)$ 应该没有任何联系。 $\mathcal{T} \in \mathbb{Z}^2$ 为有限的网格(finite grid)，可以理解为图像中一像素的位置坐标(x,y)。 $T$ 应该为向量的转置。这里h为模型参数， $\phi _x$ 为图像梯度特征。这样，对于每一点，我们有： $f_{tmpl}(x;h)=\sum_{u \in \mathcal{T}}h[u]^T \phi _x[u]$
$f_{hist}(x;\beta)$ 考虑颜色特征的打分函数，有一点点不同，在这里， $\beta$ 同样是模型参数， $\mathcal{H}$ 也同样是有限的网格(finite grid) $f_{hist}(x;\beta)=\beta ^T(\frac 1 {\lvert \mathcal{H} \rvert}\sum _{u\in \mathcal{H}} \psi _x[u])$
$\theta$ 参数 $\theta =(h,\beta)$
$L(\theta,X_T)$ 损失函数= $\sum _{t=1} ^T w_t l(x_t,p_t,\theta)$ ,这里每帧的损失函数 $l(x,p,\theta)=cost(p,argmax_{q\in S}f(T(x,q);\theta))$ ，在这里， $p$ 自然是正确的矩形。
然后得到参数的解： $h_t=argmin_h \{L_{tmpl}(h;X_t)+\frac 1 2 \lambda _{tmpl} \lVert h \rVert ^2 \}$ $\beta _t=argmin_{\beta} \{L_{hist}(\beta;X_t)+\frac 1 2 \lambda _{hist} \lVert \beta \rVert ^2 \}$

Online least-squares optimisation

上面仅仅介绍了原文的前10个公式，原文一共26个公式，就不一一介绍了。接下来主要讲大概。
这一小节通过梯度下降求解损失函数

Learning the template score

再次梯度下降求 $h$

Learning the histogram score

还是梯度下降求 $\beta$

Search strategy

本文假设矩形窗口 $p$ 有平移和缩放，但保持长宽比例和朝向（目标不旋转）
这里写图片描述

Reference

全部评论 (0)

还没有任何评论哟~

算法学习 -- Staple: Complementary Learners for Real-Time Tracking

Abstract 一个结合梯度特征HOG及颜色特征的实时跟踪算法，速度达到80FPS，即每秒80帧图像。 Introduction Staple:SumofTemplateAndPixelwiseLE...

目标跟踪“Staple: Complementary Learners for Real-Time Tracking”

综合了局部特征HOG和全局特征颜色直方图用于目标跟踪，速度达到80fps。相关工作 CorrelationFilters作为衡量信号相似度的方法被用于跟踪，主要用于rigid模板，关于CF的介绍可见...

SiamDW：Deeper and Wider Siamese Networks for Real-Time Visual Tracking

摘要 Siamese网络由于具有良好的准确性和速度而引起视觉跟踪领域的广泛关注，但其使用的网络相对比较浅，比如AlexNet，难以充分发挥深度神经网络的优势。因此，作者对如何平衡卷积神经网络的深度和宽...

MLT：Deep Meta Learning for Real-Time Target-Aware Visual Tracking

文章目录摘要背景贡献本文方法摘要本文针对传统的基于深度卷积特征的目标跟踪算法为了更好适应目标形变，需要进行复杂的优化/更新工作的问题进行改进，旨在保持较高跟踪效果的同时实现跟踪实时性。

Deep Active Contours for Real-time 6-DoF Object Tracking

这篇论文解决了从RGB视频进行实时6自由度（6DoF）物体跟踪的问题。此前的基于优化的方法通过对齐投影模型与图像来优化物体姿态，这种方法依赖于手工设计的特征，因此容易陷入次优解。最近的基于学习的方法使...

SPLT：‘Skimming-Perusal’ Tracking: A Framework for Real-Time and Robust Long-term Tracking

文章目录摘要背景贡献本文方法摘要相比传统的短期跟踪，长期跟踪需要应对更多的挑战，也更贴近真实应用场景，但这方面在目前研究进展较为缓慢，因此本文提出一个新的鲁棒的、实时的长时间跟踪框架，该框...

JDE 《Towards Real-Time Multi-Object Tracking》学习笔记

论文链接：<https://arxiv.org/pdf/1909.12605.pdf 代码链接：<https://github.com/Zhongdao/TowardsRealtimeMOT 翻译链接...

Towards Real-Time Multi-Object Tracking

作者分别是来自清华大学和澳大利亚国立大学 Abstract 现代多目标跟踪MOT系统通常遵循基于检测的跟踪模式。它具有1）用于目标定位的检测模型，以及2）用于数据关联的外观嵌入模型。分别执行这两个模型...

A Twofold Siamese Network for Real-Time Object Tracking—CVPR2018 阅读

本文在SiamFC的基础上增加了语义分支,提出了一种双重Siamese框架，进一步提升SiamFC的判别力。 Abstract. ObservingthatSemanticfeatureslearne...

[目标跟踪]‘Skimming-Perusal’ Tracking: A Framework for Real-Time and Robust Long-term Tracking

今天整理一篇关于长时跟踪的论文——SPLT。最后更新日期：20201207 论文链接：<https://arxiv.org/pdf/1909.01840.pdf 代码链接：<https://gith...

是否确定退出登录?

算法学习 -- Staple: Complementary Learners for Real-Time Tracking

Abstract

Introduction

Related Work

Proposed Approach

符号及含义

Online least-squares optimisation

Learning the template score

Learning the histogram score

Search strategy

Reference

全部评论 (0)

相关文章推荐

算法学习 -- Staple: Complementary Learners for Real-Time Tracking

目标跟踪“Staple: Complementary Learners for Real-Time Tracking”

SiamDW：Deeper and Wider Siamese Networks for Real-Time Visual Tracking

MLT：Deep Meta Learning for Real-Time Target-Aware Visual Tracking

Deep Active Contours for Real-time 6-DoF Object Tracking

SPLT：‘Skimming-Perusal’ Tracking: A Framework for Real-Time and Robust Long-term Tracking

JDE 《Towards Real-Time Multi-Object Tracking》学习笔记

Towards Real-Time Multi-Object Tracking

A Twofold Siamese Network for Real-Time Object Tracking—CVPR2018 阅读

[目标跟踪]‘Skimming-Perusal’ Tracking: A Framework for Real-Time and Robust Long-term Tracking