Advertisement

CFNet视频目标跟踪推导笔记

阅读量:

1. 论文信息

论文题目:Employing end-to-end representation learning to improve Correlation Filter-based tracking systems
论文出处:appeared at CVPR 2017 conference
论文作者:Jack Valmadre and others, including Luca Bertinetto
论文主页:http://www.robots.ox.ac.uk/~luca/cfnet.html
源码链接:https://github.com/bertinetto/cfnet

2. 滤波器求解——论文公式(7)推导过程

2.1 最优化求解

首先,定义最优化问题

其中,在信号处理领域中研究信号恢复问题时会涉及到以下关键变量:\mathbf{w}被定义为待求解的滤波器系数矩阵;令n代表样本的数量;而\mathbf{y}则被定义为每个样本对应的标签向量。在此基础上,在原有框架下进行重新表述:引入误差向量\mathbf{r}进行重新表达为{\mathbf r} = {\mathbf X}^T{\mathbb W}{\mathbb W}^\top{\boldsymbol \psi}({\boldsymbol x}) - {\boldsymbol y}

从公式(2)出发,在运用拉格朗日乘子法进行优化的过程中,请您具体参考《Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers》一书的第2.1节《Dual Ascent》中的详细描述(相关链接:https://web.stanford.edu/~boyd/papers/pdf/admm_distr_stats.pdf),在此基础上建立相应的拉格朗日表达式:

其中\bf{v}表示拉格朗日乘子,在其中用于损失函数的梯度计算过程中,在计算过程中先对目标函数J(\bf{v})求取其关于各个变量的偏导数值

现在对\bf{r}求偏导数,得

最后对求偏导数,得

现在,分别令上述三个偏导数为0,得

根据方程(7),首先求解 ,可以得到

接下来求解,有

最终,得到的解为

其中,

{\mathbf{K}} = \frac{1}{n}{{\mathbf{X}}^T}{\mathbf{X}} + \lambda {\mathbf{I}}

可被视为正则化核矩阵的一种形式。一般而言,

{\mathbf{\alpha }} = \frac{1}{\lambda }{\mathbf{v}} = \frac{1}{n}{{\mathbf{K}}^{ - 1}}{\mathbf{y}}

常被用作缩放对偶变量的定义。其作用于数据空间中的样本向量{\bm y}时,

{\bm w}

便能被表示为某种加权组合的形式。

2.2 相关滤波引入

基于现有的滤波跟踪技术特点,在此定义变量\bf{X}为循环矩阵。该矩阵满足特定周期性关系式:对于任意元素\mathbf{X}\left[ {u,t} \right]等于其循环移位后的值\mathbf{X}\left[ {u + t\bmod m} \right]。由于当前矩阵具有对称性特征,则模板\bf w将采用互相关法进行提取。

注: * 表示循环卷积操作,\star表示循环互相关操作, \odot表示矩阵元素级乘法

关于正则化核矩阵,关于它的线性映射等价于与base信号\bf k的卷积

其中{\mathbf{k}} = \frac{1}{n}{\mathbf{x}} \star {\mathbf{x}} + \lambda {\mathbf{\delta }},由于

于是,有

放到傅里叶域中,其解为

公式(16)即为论文中的公式(7),这样,相关滤波的求解表达式就完成了。

注:在傅里叶域中进行互相关运算时会附加一个共轭符号。

其中一种来源:

无论怎样,与直接卷积的结果相比会相差一个负号。

此时可以明确看出,在傅里叶变换后的互相关运算相当于对其中一个信号取复数共轭后与其另一个信号进行乘法操作。

这正是"时域卷积与频域相乘"这一概念的不同之处。

所以,请记住这个有用的结论:两个信号的互相关函数在频域等于X信号频域的复数共轭与Y信号频域的乘积。

<>

3. 反向传播公式推导过程

3.1 计算微分

在研究其架构时,论文将相关滤波器作为深度神经网络的一部分,并且,在构建网络结构的过程中,明确反向传播的数学表达式具有重要意义。

首先,根据公式(15),求解微分

将公式(17)转换到傅里叶域,有

3.2 计算反向传播

定义为J_1的映射关系式为d{\mathbf{x}} \mapsto d{\mathbf{k}}(在傅里叶域中对应于公式(18))后,随后计算该内积)

根据公式(19),计算反向传播映射

类似地,现在计算内积

得到反向传播映射

类似地,计算内积

也可以得到反向传播映射

最后,综合上述公式(20)、(22)和(24),可以得到CFNet最终的反向传播映射

最后,本推导笔记离不开富民同学的耐心帮助和博主的xiahouzuoxin的启发,在此一并表示感谢!


更多内容,欢迎扫码关注“视觉边疆”微信订阅号

这里写图片描述

全部评论 (0)

还没有任何评论哟~