【Tracking 系列:一】Siamese-FC|Fully-Convolutional Siamese Networks for Object Tracking
 发布时间 
 阅读量: 
 阅读量 
滑窗分类
SOT早期的工作
该算法主要针对单目标追踪设计,在研究论文中通过计算两个图像patch之间的相似度来进行目标定位,并通过对输入图像进行多次缩放处理以实现多尺度的目标跟踪
Method
- 网络主要分为两股独立的发展脉络
 - 这两股网络基于相同的卷积机制(siamese的意思)提取特征信息
 - 第一支络专注于从目标object(z)中获取关键特征A
 - 另一支络则负责从待搜索图片(x)中提取相关特征B
 
通过将特征A设计为卷积核,在特征B上执行卷积操作,我们能够生成一个score map。这个score map实际上反映了待搜索图像的特征B与目标object patch特征A之间的相似程度。在score map中该点的值则直接反映了原图中该区域与目标object之间的相似程度。通过这种方式我们可以有效地定位到当前帧中目标object的最佳匹配位置。



ϕ(.)是通过卷积操作分别获取 z 和 x 的特征;g(.)则是通过交叉相关计算出两个特征图之间的关联度,并以实现对相关滤波器的模拟来生成响应特征图。
training

至于具体训练的时候论文中也提到了一些细节,比如正负例的定义:
- 在score map中, 位于中心半径R范围内的点归类为正例(label=1), 其余点归类为负例(label=-1)
 - 输出的score map应用cosine window to reduce the weights of points farther from the center region.
 - 多尺度物体的检测基于resized input image进行.
 
Network
AlexNet

Result

Thoughts
相当于滑窗分类。
从分类的角度来做位置的定位的
对于宽高比无法做出响应,影响精度上限
online-tracking的通用劣势,对初始化的框非常敏感
全部评论 (0)
 还没有任何评论哟~ 
