Advertisement

【Tracking 系列:一】Siamese-FC|Fully-Convolutional Siamese Networks for Object Tracking

阅读量:

滑窗分类

SOT早期的工作

该算法主要针对单目标追踪设计,在研究论文中通过计算两个图像patch之间的相似度来进行目标定位,并通过对输入图像进行多次缩放处理以实现多尺度的目标跟踪

Method

  • 网络主要分为两股独立的发展脉络
  • 这两股网络基于相同的卷积机制(siamese的意思)提取特征信息
  • 第一支络专注于从目标object(z)中获取关键特征A
  • 另一支络则负责从待搜索图片(x)中提取相关特征B

通过将特征A设计为卷积核,在特征B上执行卷积操作,我们能够生成一个score map。这个score map实际上反映了待搜索图像的特征B与目标object patch特征A之间的相似程度。在score map中该点的值则直接反映了原图中该区域与目标object之间的相似程度。通过这种方式我们可以有效地定位到当前帧中目标object的最佳匹配位置。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

ϕ(.)是通过卷积操作分别获取 z 和 x 的特征;g(.)则是通过交叉相关计算出两个特征图之间的关联度,并以实现对相关滤波器的模拟来生成响应特征图。

training

在这里插入图片描述

至于具体训练的时候论文中也提到了一些细节,比如正负例的定义:

  • 在score map中, 位于中心半径R范围内的点归类为正例(label=1), 其余点归类为负例(label=-1)
  • 输出的score map应用cosine window to reduce the weights of points farther from the center region.
  • 多尺度物体的检测基于resized input image进行.

Network

AlexNet

Result

在这里插入图片描述

Thoughts

相当于滑窗分类。

从分类的角度来做位置的定位的

对于宽高比无法做出响应,影响精度上限

online-tracking的通用劣势,对初始化的框非常敏感

全部评论 (0)

还没有任何评论哟~