Advertisement

目标跟踪“Staple: Complementary Learners for Real-Time Tracking”

阅读量:

综合了局部特征HOG和全局特征颜色直方图用于目标跟踪,速度达到80fps。

相关工作
Correlation Filters作为衡量信号相似度的方法被用于跟踪,主要用于rigid模板,关于CF的介绍可见:
http://www.cnblogs.com/hanhuili/p/4266990.html

CF从圆形位移中学习,而颜色直方图对圆形位移不变,要解决变形问题,就要学习可变模板。

方法描述
使用tracking-by-detection流程,目标在t帧中的位置由图像x_t中的具有最大得分的矩形框p:
p_t=arg max_{p\in S_t}f(T(x_t,p);\theta_{t-1}) (1)
模型参数\theta通过最小化损失函数求得:
\theta_t = arg min_{\theta\in Q}\{L(\theta;X_t)+\lambda R(\theta)\} (2)
给定第一帧中目标的位置,打分函数f和损失函数L的选取比较关键。作者给出了一个组合模板和直方图得分的打分函数,即:
f(x)=\gamma_{tmpl}f_{tmpl}(x)+\gamma_{hist}f_{hist}(x) (3)
模板得分K通道特征图像的线性函数,即:
f_{tmpl}(x;h)=\Sigma_{u\in T}h[u]^T\phi_x[u] (4)
直方图得分由M通道的图像计算得到:
f_hist(x;\beta)=g(\psi_x;\beta) (5)
为了加速计算,重叠窗口应该共享特征计算,直方图得分可以用积分图像计算,整个模型的参数为(h,\beta),设训练损失为单个图像损失的加权线性组合,即:
L(\theta,X_T)=\Sigma_{t=1}^Tw_tl(x_t,p_t,\theta) (8)
每个图像的损失为:
l(x,p,\theta)=d(p,arg max_{q\in S}f(T(x,q);\theta)) (9)

通过解决两个独立的rigid回归问题学习模型:
这里写图片描述

下图为学习过程的可视化表示:
这里写图片描述

最小平方优化
L(\theta;X)f(x;\theta)的凸二次函数,且f(x;\theta)对于\theta是线性的,则存在矩阵A_t和向量b_t使得:
这里写图片描述

学习模板得分
在最小平方Correlation Filter情况下,每个图像的损失为:
l_{tmpl}(x,p,)=||\Sigma_{k=1}^Kh^k*\phi^k-y||^2
h为输入图像,\phi为滤波模板?y为理想响应(通常为高斯分布的函数)。使用\hat x表示离散傅里叶变换,归一化的目标函数为:
\hat h[u]=(\hat s[u]+\lambda I)^{-1}\hat r[u]

学习直方图得分
每个图像的损失为:
l_hist(x,p,\beta )=\Sigma_{(q,y)\in W}(\beta^T[\Sigma_{u\in H}\psi_{T(x,q)}[u]]-y)^2
使用的特征RGB颜色,或者LBP,直方图得分可以使用平均投票,这里使用每个图像的目标函数对每个特征像素进行线性回归,即:
l_hist(x,p,\beta )=\frac {1}{O}\Sigma_{u\in O}(\beta^T\psi [u]-1)^2+\frac{1}{B}\Sigma_{u\in B}(\beta^T\psi[u])^2

实验结果
在VOT14上的实验结果为:
这里写图片描述

全部评论 (0)

还没有任何评论哟~