Paper阅读：Dynamic-SLAM

阅读量：

Paper阅读：Dynamic-SLAM

引言
- 漏检校正算法
- 选择性追踪方法
- 总结

前言

论文原文：Semantic monocular visual localization and mapping based on deep learning in dynamic environment
在动态环境中工作时（operate in），由于动态对象（dynamic objects）的存在（exist），传统的SLAM框架（traditional SLAM frameworks）表现出色（perform well）。通过在对象检测（object detection）中融入深度学习的优势（advantages），提出了一种语义动态的动态地图定位和映射框架Dynamic-SLAM（proposed framework, Dynamic-SLAM），以解决传统SLAM方法在复杂环境中的不足（challenges of traditional SLAM approaches in complex environments）。

本文的主要三大贡献：

本研究针对SLAM系统开发了一种基于相邻帧速度恒定特性设计的丢失检测补偿机制。该算法显著提升了该系统在SSD模型中的识别准确率，并为后续模块的有效运行提供了可靠的技术支撑。

开发出一种基于选择性跟踪的技术方案，在复杂场景中实现了动态目标的实时剔除功能；该算法通过简洁高效的算法机制实现动态目标的实时剔除，在提升系统性能的同时显著提升了系统在复杂环境下的稳定性和测量精度。

开发了一个以SSD为基础的视觉感知动态定位与建模系统。通过整合目标跟踪算法并行处理框架，并将其检测结果作为先验知识显著提升了系统的定位精度和实时性。

主要希望解决问题：动态环境下的SLAM。

Missed detection compensation algorithm(漏检补偿算法)

传统目标检测任务受限于仅依赖单个图像提取特征这一局限性，在提升基于上下文的信息利用方面仍有较大空间。然而在SLAM框架下视频帧按照时间顺序依次到达检测系统能够在当前帧的基础上检索并融合历史数据随着对历史数据的逐步推演进而推断出下一个时间段内的潜在物体信息对于动态场景下的目标检测问题 Recall rate更为关键

$\frac {TP}{TP+FN}$

模型基于以下合理假定：动态物体的速度在短时间内趋于稳定不变（即加速度趋近于零）。以 $v$ 表示动态物体的速度，并设定像素平面中动态物体速度变化率的上限为 $a_{max}$ 。由此可得关系式： $\Delta v$ 不超过 $a_{max}$ 。

通过前一帧和当前帧之间的边界框差分 $∆v$ 进行确定，在某种程度上也可以预测上一帧物体在当前帧的位置变化。其中，

^Ka_i

表示预测的物体中心位置坐标值，
其由上一帧物体位置坐标值、前几帧该物体位移的平均值以及容错阈值三部分组成。
而经过漏检补偿后的估计中心坐标

^K\hat{c}

则仅由上一帧物体位置坐标值和前几帧该物体位移的平均值两部分构成。

该方法会生成一组目标物体列表。随后将对前一帧中出现过的每个目标物列表进行循环处理，并估算其在当前帧中的bounding box位置。接着对当前帧的所有bounding box进行检查以确定是否存在被预测框覆盖的情况：如果存在，则判定该目标在当前帧内被检测到；若不存在，则表明该目标未被检测到；从而将其标记为已检测。

效果：

Seletive Tracking Method（选择跟踪算法）

作用：避免提取或尽量减少涉及dynamic object 的特征点提取，以降低Bundle Adjustment求解误差。

作者阐述了一种对一些动态物体实例给予评分的标准,但随后似乎没有提及如何利用这些分数.

在完成特征点匹配后，在随后的步骤中通常会调用PnP算法计算初始位姿估计，并接着采用Bundle Adjustment（B Bundle Adjustment）方法以最小化重投影误差。

Dynamic-SLAM中，把动态物体区域（Mask）设为1，非动态物体区域设为0：

基于以下公式的核心研究内容中包含两个关键部分：第一部分由第13个公式描述用于计算静止点的平均偏移量；第二部分由第12个公式定义用于判断运动点相对于静止点平均偏移量乘以阈值的关系。若运动点的位移量超过上述结果，则表明该运动点存在显著运动特性而不适合作为贝叶斯优化（BA）的一部分参与求解；因此需要将其排除出该特征集外进行处理。

整体算法如下：首先遍历当前帧的所有特征点。随后计算这些特征点中属于静态区域的部分的平均偏移量。对于每一个待判断的点而言，在比较其与所有静态特征点之间的距离时，请注意乘以一个预设的比例系数。只有当该距离值低于预先设定的标准时才可将其归类为动态区域中的关键跟踪目标。

效果如下：

总结

这篇综述是本人首次深入探讨语义SLAM领域的文献。此前有多位同行对这类技术表示高度关注（这通常与其开源属性不无关系）。其核心关注点并非传统的构图问题，而是通过深度学习手段显著提升了姿态估计的精度。就现有研究而言，在深度学习框架下结合SLAM的技术整合路径相较于传统理论算法具有显著优势（这一优势体现在实现复杂度和实际效果上），但未来在相关领域仍值得关注的新颖思路和技术突破仍有待探索。

全部评论 (0)

还没有任何评论哟~

Paper阅读：Dynamic-SLAM

Paper阅读：DynamicSLAM 前言 Misseddetectioncompensationalgorithm漏检补偿算法 SeletiveTrackingMethod（选择跟踪算法）总结 ...

论文阅读：Gassidy: Gaussian Splatting SLAM in Dynamic Environments

III.DESIGNINGGASSIDY 本节介绍Gassidy的架构，详细介绍使用3DGS提取环境特征，解释在跟踪中通过渲染损失流过滤动态变化，并描述使用滤波高斯函数进行场景优化。

【论文阅读】NGD-SLAM: Towards Real-Time SLAM for Dynamic Environments without GPU

arxiv上一篇很新的视觉SLAM论文，能够在不使用GPU的情况下进行语义分割的辅助运算。一、跟踪流程作为一个语义结合的视觉SLAM，其基本的思路和以前看过的DynaSLAM基本类似，都是依赖语义...

paper阅读：Sparse Structure Selection

DataDriveSparseStructureSelectionforDeepNeuralNetworks https://openaccess.thecvf.com/contentECCV2018...

SLAM代码（ORB-SLAM阅读）

主要步骤 1\.为什么是这样的步骤，为什么只要这几个步骤，为什么是这样的顺序？ 2\.这样做的目的是什么？步骤1.1 ORB的跟踪器使用一个运动模型，在每次完成位姿计算之后会跟新这个运动模型，根据匀...

Paper 文献阅读一： Resnet

文章目录 Paper文献阅读一：Resnet 网络退化degradation问题退化问题体现的问题为什么残差更好估计？极端情况Hx=x 其它情况残差网络的buildingblock short...

Dynamic Head论文阅读

摘要：目标检测中定位与分类相结合的复杂性导致了各种方法的蓬勃发展。以前的工作试图提高在各种目标检测头部的性能，但未能呈现一个统一的视图。在本文中，我们提出了一种新的动态头部框架来统一目标检测头部和注意...

多目slam论文阅读系列一：MULTICOL-SLAM论文阅读

论文地址：<https://arxiv.org/pdf/1610.07336.pdf 代码：GitHuburbste/MultiColSLAM:Thisrepositorycontainsamulti...

VOT竞赛paper阅读笔记

VOT2019 摘要视觉对象跟踪挑战赛VOT2019是VOT倡议组织的第七次年度跟踪器基准测试活动。给出了81个跟踪器的结果；许多是近年来在大型计算机视觉会议或期刊上发表的最先进的跟踪器。评估包括短...

某节的OmniHuman-1 paper 阅读

本文提出了OmniHuman，一个基于扩散Transformer的框架，通过在训练阶段混合与运动相关的条件来扩展数据规模。为此，引入了两种针对这些混合条件的训练原则，并提出了相应的模型架构和推理策略...

是否确定退出登录?

Paper阅读：Dynamic-SLAM

Paper阅读：Dynamic-SLAM

前言

Missed detection compensation algorithm(漏检补偿算法)

Seletive Tracking Method（选择跟踪算法）

总结

全部评论 (0)

相关文章推荐

Paper阅读：Dynamic-SLAM

论文阅读：Gassidy: Gaussian Splatting SLAM in Dynamic Environments

【论文阅读】NGD-SLAM: Towards Real-Time SLAM for Dynamic Environments without GPU

paper阅读：Sparse Structure Selection

SLAM代码（ORB-SLAM阅读）

Paper 文献阅读一： Resnet

Dynamic Head论文阅读

多目slam论文阅读系列一：MULTICOL-SLAM论文阅读

VOT竞赛paper阅读笔记

某节的OmniHuman-1 paper 阅读