Advertisement

SiamCAR: Siamese Fully Convolutional Classification and Regression for Visual Tracking 阅读记录

阅读量:
在这里插入图片描述
  • 将视觉跟踪任务分解成两个子任务:像素分类和边界框回归
  • SiamCAR框架包含两个子网络:一个用于特征提取,一个用于预测边界框
  • 使用ResNet-50作为主干网络
  • 与其他的最先进的跟踪算法比较,本文提出的框架是描点自由和无提议区域,这样能够避免复杂的超参数调整和减少人工干涉
  • 所提出的框架简单,有效
  • 在现实生活中的跟踪,算法会受到光照变化,尺度变化大,背景干扰和严重遮挡问题
  • 除上述外,非刚性的物体的形状或者外观会发生不可预知的变化
  • Siamese网络将视觉跟踪任务定义为目标匹配问题,目的是学习目标模板和搜索区域之间的相似图
  • 由于单个相似图像通常包含有限的空间信息,一种常见的策略实在搜索区域的多个尺度上进行匹配,以确定目标的尺度变化。但是这样也导致了一些追踪器费时费力
  • 通过联合训练一个分类分支和一个回归分支用于跟踪,SiamRPN避免了耗时的步骤,并且也能够提取多尺度特征图的目标尺度不变性
  • SiamRPN等网络将锚点引入到目标区域中,而跟踪器对描点较为敏感
  • 为了引入描点自由,这篇论文将跟踪问题分解为:分类问题和回归问题
  • 分类分支:目的是将每个像素预测为一个标签
  • 回归分支:将每个位置回归为一个相对的包围框
  • 经过这样分解后,可以以逐像素预测的方式解决跟踪任务
  • SiamCAR旨在提取包含丰富类别信息和语义信息的响应图
  • SiamCAR只使用一个响应图去预测物体的位置和包围框
  • 代码使用在线训练和离线跟踪的方法,并且没有使用到数据增强策略
  • Siamese RPN及其类似的跟踪器,是近年来广被研究的对象
  • 模板更新策略可以提高模型的自适应性,但跟踪的效率较低。另外,模板更新中普遍存在着跟踪漂移的问题
  • 关于滤波的策略,有些工作也让跟踪器取得了较好的精度和效率
  • 目前的研究表明,基于Siamese网络的在线训练方法和基于深度神经网络的离线跟踪方法在精度和效率之间达到了最佳的平衡
  • 基于描点的工作需要进行复杂的调参,需要谨慎的调节和丰富的经验
  • 基于描点的包围盒尺寸和长宽比是固定的,因此不太能很好的包括目标物体
  • 这篇文章证明了一个结构简单的跟踪器也能实现很好的性能(跟踪精度和效率)
  • 使用无填充的全卷积网络构造Siamese子网络进行视觉特征的提取
  • Depth-wise Cross Correlation:31-7+1 = 25 相当于使用论文里的Z作为核,X作为被卷张量。1*1的内核为通道为1,但是大小还是Z的大小
  • 利用低层特征(边角颜色)和高层特征(网络提取出的东西,语义等)进行融合来提高跟踪精度
  • 从主干网络中的后三层中提取特征图进行特征复合
  • 设gt的中心点为(x,y),那计算IOU的l=(x-x_0), t=(y-y_0),r=(x_1-x),b=(y1-y)
  • 远离目标中心的位置往往产生低质量的预测边框,这降低了跟踪系统的性能

全部评论 (0)

还没有任何评论哟~