Advertisement

Paper阅读:Dynamic-SLAM

阅读量:

Paper阅读:Dynamic-SLAM

  • 引言
    • 漏检校正算法
    • 选择性追踪方法
    • 总结

前言

论文原文:Semantic monocular visual localization and mapping based on deep learning in dynamic environment
在动态环境中工作时(operate in),由于动态对象(dynamic objects)的存在(exist),传统的SLAM框架(traditional SLAM frameworks)表现出色(perform well)。 通过在对象检测(object detection)中融入深度学习的优势(advantages),提出了一种语义动态的动态地图定位和映射框架Dynamic-SLAM(proposed framework, Dynamic-SLAM),以解决传统SLAM方法在复杂环境中的不足(challenges of traditional SLAM approaches in complex environments)。

本文的主要三大贡献:

本研究针对SLAM系统开发了一种基于相邻帧速度恒定特性设计的丢失检测补偿机制。该算法显著提升了该系统在SSD模型中的识别准确率,并为后续模块的有效运行提供了可靠的技术支撑。

开发出一种基于选择性跟踪的技术方案,在复杂场景中实现了动态目标的实时剔除功能;该算法通过简洁高效的算法机制实现动态目标的实时剔除,在提升系统性能的同时显著提升了系统在复杂环境下的稳定性和测量精度。

开发了一个以SSD为基础的视觉感知动态定位与建模系统。通过整合目标跟踪算法并行处理框架,并将其检测结果作为先验知识显著提升了系统的定位精度和实时性。

主要希望解决问题:动态环境下的SLAM。

在这里插入图片描述

Missed detection compensation algorithm(漏检补偿算法)

传统目标检测任务受限于仅依赖单个图像提取特征这一局限性,在提升基于上下文的信息利用方面仍有较大空间。然而在SLAM框架下 视频帧按照时间顺序依次到达 检测系统能够在当前帧的基础上检索并融合历史数据 随着对历史数据的逐步推演 进而推断出下一个时间段内的潜在物体信息 对于动态场景下的目标检测问题 Recall rate更为关键

\frac {TP}{TP+FN}

模型基于以下合理假定:动态物体的速度在短时间内趋于稳定不变(即加速度趋近于零)。 以v表示动态物体的速度,并设定像素平面中动态物体速度变化率的上限为a_{max}。 由此可得关系式:\Delta v不超过a_{max}

通过前一帧和当前帧之间的边界框差分∆v进行确定,在某种程度上也可以预测上一帧物体在当前帧的位置变化。其中,

^Ka_i

表示预测的物体中心位置坐标值,
其由上一帧物体位置坐标值、前几帧该物体位移的平均值以及容错阈值三部分组成。
而经过漏检补偿后的估计中心坐标

^K\hat{c}

则仅由上一帧物体位置坐标值和前几帧该物体位移的平均值两部分构成。

在这里插入图片描述

该方法会生成一组目标物体列表。随后将对前一帧中出现过的每个目标物列表进行循环处理,并估算其在当前帧中的bounding box位置。接着对当前帧的所有bounding box进行检查以确定是否存在被预测框覆盖的情况:如果存在,则判定该目标在当前帧内被检测到;若不存在,则表明该目标未被检测到;从而将其标记为已检测。

在这里插入图片描述

效果:

在这里插入图片描述
在这里插入图片描述

Seletive Tracking Method(选择跟踪算法)

作用:避免提取或尽量减少涉及dynamic object 的特征点提取,以降低Bundle Adjustment求解误差。

作者阐述了一种对一些动态物体实例给予评分的标准,但随后似乎没有提及如何利用这些分数.

在这里插入图片描述

在完成特征点匹配后,在随后的步骤中通常会调用PnP算法计算初始位姿估计,并接着采用Bundle Adjustment(B Bundle Adjustment)方法以最小化重投影误差。

在这里插入图片描述

Dynamic-SLAM中,把动态物体区域(Mask)设为1,非动态物体区域设为0:

在这里插入图片描述

基于以下公式的核心研究内容中包含两个关键部分:第一部分由第13个公式描述用于计算静止点的平均偏移量;第二部分由第12个公式定义用于判断运动点相对于静止点平均偏移量乘以阈值的关系。若运动点的位移量超过上述结果,则表明该运动点存在显著运动特性而不适合作为贝叶斯优化(BA)的一部分参与求解;因此需要将其排除出该特征集外进行处理。

在这里插入图片描述

整体算法如下:首先遍历当前帧的所有特征点。随后计算这些特征点中属于静态区域的部分的平均偏移量。对于每一个待判断的点而言,在比较其与所有静态特征点之间的距离时,请注意乘以一个预设的比例系数。只有当该距离值低于预先设定的标准时才可将其归类为动态区域中的关键跟踪目标。

在这里插入图片描述

效果如下:

在这里插入图片描述
在这里插入图片描述

总结

这篇综述是本人首次深入探讨语义SLAM领域的文献。此前有多位同行对这类技术表示高度关注(这通常与其开源属性不无关系)。其核心关注点并非传统的构图问题,而是通过深度学习手段显著提升了姿态估计的精度。就现有研究而言,在深度学习框架下结合SLAM的技术整合路径相较于传统理论算法具有显著优势(这一优势体现在实现复杂度和实际效果上),但未来在相关领域仍值得关注的新颖思路和技术突破仍有待探索。

全部评论 (0)

还没有任何评论哟~