SLAM视觉词典创建与应用
SLAM视觉词典创建与应用
主要内容:
一、单目视觉SLAM
二、自然特征提取及视觉词典创建
三、视觉词典的人工路标模型创建
四、闭环检测
五、混合人工自然特征的单目视觉SLAM
六、发展方向
一、单目视觉SLAM
1.环境特征
分类:自然特征和人工特征;
必要性:移动SLAM机器人必须依靠实时采集环境特征信息并完成自身定位的过程。
2.面临问题:
既包含路标的姿态估计工作,也包含机器人姿态与运动轨迹优化的过程。(在许多实际应用中,在动态环境下完成对环境地图以及移动机器人的实时定位与建图具有较高的技术难度,在这一过程中机器人定位与环境地图构建之间存在高度的相互依存关系以及复杂的耦合效应。)
3.解决方案
目前主要有两种解决方案:基于滤波器的方法和基于图的方法。

(2) 基于图的SLAM(Graph-basedSLAM)

算法专注于识别最大可行的节点结构,并输出全局最优位姿图(近年来随着出现了高效的求解方法,在图基SLAM技术上取得了显著进展,并逐渐成为当前SLAM研究的核心关注点)
二、自然特征提取及视觉词典创建
2.1自然路标
优点:它不影响现有工作环境;无需新增任何设施或信息;并且广泛存在于环境中。
缺点:受环境的影响较大,易受光线、遮挡、视角及环境相似度等变化的影响
2.2视觉词典
视觉词典是一种用于图像分类与检索的图像建模方法,在多个相关领域如计算机视觉和信息检索中得到广泛应用。该方法起源于文档分析领域中的词库表示法。其中,词库表示法通过特征向量的方式将文档表征为关键词在特定语义空间中的频率分布。
2.3自然特征视觉词典创建框架

2.4具体实施
基于 SURF(SpeededUp Robust Features)算法提取图像的空间特征向量;其优势在于能够有效保留图像原有的色彩信息,并解决了 SIFT 算法计算数据量大、时间复杂度高以及运行时间长等计算效率低的问题;具体而言,在这一过程中可以通过 64 维特征向量构建特征点描述符,并以此实现运算速度与精确度的双重提升
(2)将具有相似特性的SURF自然视觉向量进行分类划分,并通过K均值聚类算法对局部视觉特征集合进行分组处理;每个簇的核心即代表一个自然视觉词汇
(3)在自定义视图中对每个条目进行排序和筛选操作时,请确保排序依据和筛选条件清晰明了,并且在排序过程中避免影响数据完整性


2.5实例
包括:室内走廊和室外视觉词典





三、视觉词典的人工路标模型创建



四、闭环检测
在视觉 SLAM 闭环检测领域中,大多数算法都采用精确构建基于图像特征的场景模型这一策略,并随后依据场景特征实施闭环检验
BoVW(Bagof visual words)算法步骤:
用SIFT或SURF算子计算图像各个局部区域的特征向量,并确保这些特征向量具有相同的维度。
②将检测到的局部特征集合进行聚类,每个聚类中心对应一个视觉单词;
建立表征图像的视觉词汇库,并根据需求对视觉单词的数量进行优化以用于评估视觉词汇库的规模。
④图像由视觉词典中的视觉单词权重向量表征。
BoVW(Bag of Visual Words)算法将一副图像类比为一篇文档
①SLAM采集图像具有时间连续性,利用时间连续性提升检测的准确性。
②图像匹配相似度计算方法与视觉SLAM的时间连续特征之间存在密切关联。通过贝叶斯滤波将当前观测数据(即当前图像匹配相似度)与前一状态信息相结合,并以此推导出当前时刻闭环检测的概率值。基于此原理设计了一种基于贝叶斯滤波框架下的闭环检测跟踪算法
4.1基于人工视觉词典的闭合检测算法:

4.2基于贝叶斯滤波闭环检测算法:
相似度

图像内存管理


五、混合人工自然特征的单目视SLAM
5.1算法整体框架



六、发展方向
借助Wifi或者伪卫星信号;
三维场景地图实时性构建;
机器人陌生环境内学习(模拟人类学习过程)以及高效内存管理模式;
设定室内路标的规范;
POS 系统微型化;
