Advertisement

MDNet视频目标跟踪算法中的重检测机制分析

阅读量:

1. 论文基本信息

本文的参考代码为上述高亮版本的代码。

2. 网络结构图

论文的详细网络结构如下图所示:

在这里插入图片描述

3. 重要变量

MDNet算法在跟踪阶段旨在实现更高的鲁棒性,在算法设计中引入了检测机制以应对不同场景下的挑战。首先查阅源码中定义的关键参数设置:包括跟踪窗口大小、目标特征提取尺度以及多尺度融合权重等核心组件参数。

result. 这是一个数组,在计算过程中得到了预设的目标位置坐标[x,y,width,height]。
result_bb. 这是一个数组,在上一步骤的结果基础上进行了回归分析以获得新的预测框坐标[x',y',width',height']。
success. 这是一个布尔类型变量,在当前状态下指示所选目标图像的质量情况。当该变量为1时表明图像可靠可被选中,默认情况下为0。

3. 重检测流程

MDNet中的目标重检测可被看作是两个阶段:定位阶段与边界回归阶段。该算法首先通过MDNet最终分类得分生成对目标的位置预测。具体而言,在256个候选区域的概率得分中实施排序操作,并选取前五名样本计算其坐标参数均值。

为了确定预定位的可靠性,具体步骤如下:选取得分最高的前五个候选样本,并计算其平均得分为;若该平均值大于零,则判定得分为可靠;反之,则判定预定位不可靠。

如果预定位结果稳定,则使用本模型自身设计的边界检测器对上述5个候选样本完成一次边框回归,并以期望获得更为准确的边界坐标信息[x', y', width', height']

如果预定位结果不可靠,就准备在下一帧中扩大搜索范围,以期找回目标。

重检测流程图如下图所示:

Created with Raphaël 2.2.0 开始节点 预定位检测 预定位检测的有效性如何? 采集前五个高质量样本(k=5) 通过回归器进行边框回归 结束节点 调整采样范围参数 增大该参数值以实现全局搜索下一帧的目标框位置 直接将上一帧的预定位结果作为当前帧的目标框位置

全部评论 (0)

还没有任何评论哟~