Advertisement

论文笔记—POU-SLAM: Scan-to-Model Matching Based on 3D Voxels

阅读量:

论文笔记—POU-SLAM: Scan-to-Model Matching Based on 3D Voxels

文章摘要

LiDAR数据的定位与地图生成是自动驾驶汽车的关键组成要素之一。尽管与视觉信息相比较而言, LiDAR点云一般都能够对场景深度进行编码,但基于激光同步定位与建图(SLAM)技术仍然面临诸多挑战,因为这些数据通常呈现稀疏性且分布密度不一,同时判别力较弱。本文旨在提出一种精确可靠的基于激光SLAM方案。设计/方法/方法:该方案始于基于3D输入点云构建体素网格的过程。随后将这些体素根据各自所包含空间分布的点划分成三种类型,用以标识不同的物理物体类别。在地图构建的过程中,我们维护一个具有统一区域划分(POU)隐式表面的整体环境模型,这些体素通过Levenberg-Marquardt算法逐步整合至模型中完成构建过程发现:本文提出了一种基于激光SLAM的方法,该方法采用POU隐式表面表示来进行建模,并在KITTI里程表基准测试集上进行了非闭环条件下的评估实验.相比于LOAM算法,本文的方法实现了约30%的转换估计精度提升,但在计算效率方面有所牺牲总的来说,本文通过采用更为复杂的表面表示策略来提高建图精度的同时也在计算效率上做出了权衡

导语

~~~~~~~自动驾驶汽车的可靠定位是一个有吸引力的研究课题,因为它是导航和其他任务的基本要求[1-5]。 完全自动驾驶的车辆应该可靠地定位自己,理想情况下,仅使用板载自己的传感器,而不依赖于GPS等外部信息源。 在此类外部信息绝对不可用的情况下,同时进行本地化定位和映射(SLAM)始终是一种替代选择。
在过去的几十年中,对SLAM进行了深入研究,并针对室内和室外环境提出了基于不同传感器的各种解决方案。在室外场景中,LiDAR相对于相机的优势在于,与每次测量相关的噪声与距离本身无关,并且通常对光照变化更稳定。因此,基于激光的SLAM正成为户外场景中的主流解决方案之一。大多数基于激光的SLAM方法倾向于从点提取稳定的特征(例如平面和边缘),然后在“特征空间”中进行SLAM。因此,它们被归类为基于特征的SLAM,其性能主要取决于两个因素。第一个因素是特征的设计方式。[6,7]提出了一种基于曲率的平面和边缘特征设计方法。[8]将根据点云的几何统计计算得出的形状信息合并到迭代最近点(ICP)对应步骤中。第二个因素是扫描匹配方法。扫描匹配和模型匹配是SLAM中两个主要的扫描匹配框架。[9]提出了一种使用卷积神经网络处理LiDAR点云的扫描到扫描测距轨迹估计方法。[10]通过使用隐式表面作为模型来实现扫描到模型的匹配。基于激光的最新SLAM方法,激光雷达测距和建图(LOAM)[6]提取与物理表面相对应的独特特征为了实现在线实施,LOAM在10Hz的扫描到扫描和1Hz的更新频率下的扫描到模型操作之间切换。尽管LOAM取得了良好的性能,但是在使用3D激光传感器的户外应用中仍然存在挑战,即:
(1)由于点云稀疏而导致的固有点匹配误差,这意味着当我们直接使用稀疏矩阵时,总会存在误差点云以适应环境的表面。此外,几乎不可能获得扫描之间的刚性点对应关系。
(2)由于点云的密度变化,很难固定匹配参数。在基于特征的匹配过程中,需要提取一个3D点的足够的上下文信息以使其具有区分性,而主要上下文的范围受点密度的很大影响。为了克服上述挑战,我们引入了POU隐式表面表示,以稀疏点对环境表面进行回归,可以有效地对详细的几何信息进行编码。我们将点云离散化为3D体素。根据体素中包含的点的几何特征,将这些体素分为平面体素和边缘特征体素。最后,我们构建了特征体素地图以进行进一步的扫描到模型匹配,在此期间,提出了POU隐式表面表示以适应体素地图。我们的工作的主要贡献如下:
(1)我们提出了一种新颖的特征体素地图,其中存储了具有显着的平面或边缘特征的体素。
(2)我们提出了一种使用POU隐式表面表示的扫描模型匹配框架。

相关工作

基于摄像头与LiDAR融合的SLAM技术在机器人与计算机视觉领域获得了广泛关注。 我们认可了该领域众多研究者的努力,并聚焦于基于LiDAR技术的独特优势。 其中特征提取、激光建模与扫描匹配算法构成了基于激光雷达的关键技术基础。 通过对这些核心技术展开深入研究,并系统阐述了其运行机制与应用前景。

A.特征提取

~~~~~~~LOAM主要关注LiDAR扫描中的边缘和平面特征,并将其保存在地图中用于边缘-线和平面-平面表面匹配。 [11]的研究则利用这些特征来解决连续扫描中6-DOF变换的不同分量。尽管这些研究主要基于曲率提取特征, 但仍存在一些差异, 如文献[11]所述, 该方法经过地面优化, 因为在分割和优化步骤中它利用了地平面的存在特性. J Lalonde及其团队利用高分辨率和高密度的Zoller–Fröhlich Z + F激光器获取了点云数据. [12,13]通过分析点云几何统计将自然地形划分为散度区域、线性区域和表面区域. Michael Bosse等研究者则基于点云几何统计特征实现了扫描匹配. 他们采用ICP算法对齐质心点云, 并成功减少了 scan matching所需点数量及地图体积. 相比文献[8], 我们更加巧妙地考虑了点的几何特性, 并实现了与原始点集的 scan matching而避免了信息丢失.

B.激光建图

~~~~~~~ SLAM系统常见地构建和维护环境图[6,7,11,14,15]、密集图[16,17]以及基于正态分布变换(NDT)的地图[20,21]等不同类型的图形表示。 在基于激光的数据驱动SLAM系统中[8],通常会从原始点云中提取出具有结构性特性的表面和角点集合作为特征图[9]。 本文提出了一种新的方法,在这种框架下通过体素表示法不仅能够存储更多类型的额外信息(如颜色、纹理等),而且能够实现对复杂环境的高效建模与更新过程。 相较于现有文献中的相关方法[10-13],我们通过引入多分辨率采样策略显著提高了算法的鲁棒性和适应性。

C.扫描匹配框架:

最近的一些基于激光器的SLAM系统已经实现了扫描到模型匹配框架的应用,并通过KITTI里程表基准获得了最先进水平的表现。研究者们在[16]中提出了一种基于激光雷达的密集型SLAM方法。他们开发了一个波浪图,并利用点对面ICP算法[22,23]来进行车辆姿态变换估计。值得注意的是,在本文的研究中所采用的方法本质上属于扫描到模型匹配框架这一范畴。

D.统一分区方法:

~~~~~~~POU方法已被广泛应用用于表面重建。 文献[24]详细阐述了基于具有特定属性的离散点集构建多尺度隐式曲面的方法。 研究[25]引入了一种创新性的3D非刚性配准算法,并通过变分公式实现了对两个单位隐含曲面进行多级分区的精确配准。

特征提取

如文献[26]所述的方法类似

A.计算形状参数

持续细分输入点云所覆盖的局部空间区域,并使每个体素内的采样点数量达到预设阈值N_p。该阈值与LiDAR设备的空间分辨率直接相关联。 在特征提取过程中,在相应体素内各维度上的数据密度会发生动态变化,在探索特征间的对应关系时会考虑这一密度分布特性。 特别地,在实际应用中发现,在特定半径范围内采样足够的对应关系样本的概率随着密度降低而显著下降。 为了获得稳定的实验结果输出,在本研究中将采样阈值设定为25个采样点/体素较为合适。其中每个体素不仅包含其中的所有采样点位置信息(X_i)= (x_i,y_i,z_i)^T), 同时也包含该区域内质心位置坐标信息(\mu,S), 其中\mu,S分别表示该区域内的质心坐标矩阵及其协方差矩阵参数

公式1,2

参考文献[8]中, 矩阵S被分解为按特征值递增顺序排列的主成分构成. \vec{e_0}, \vec{e_1}, \vec{e_3}分别对应于特征值λ₀、λ₁和λ₂, 其中λ₀≥λ₁≥λ₂. 当体素中的点呈现线性结构时, 主方向即为曲线切线方向. 在这种情况下, 特征值满足λ₀≥λ₁≈λ₂. 而当体素中的点呈现固体表面结构时, 主方向将与表面法线对齐, 此时满足条件λ₀≈λ₁≥λ₂. 两个显著特性(称为线性特性和表面特性)是通过特征值的线性组合来表征的. 图1展示了所采用的功能示意图. 数量:

公式3

是体素中点的线性特征,范围从0到1。类似地,数量:

公式4

是体素中点的表面特征,范围从0到0.5。

图片1

B. 体素采样策略

~~~~~~~本质上,基于体素的扫描匹配过程是为了构建体素之间的关联,可以认为具有大量线性或平面度的体素往往比其他体素更稳定。 因此,对于每个输入点云,我们根据提议的数量将其3d网格分类为三种类型:边缘体素,平面体素和其他类型。 此外,应注意,接地点通常包含更多的平面特征,非接地点通常同时包含平面和边缘特征。 考虑到这些因素,我们首先使用[31]中提出的方法将整个点云分为地面和非地面部分。 图2a是地面分割结果的示例。 然后,对于非地面点,我们提取平面和边缘特征,而地面点仅提取平面特征。
在现在表示为体素质心的每次扫描中,我们根据体素的线性值c和表面度值p对体素进行排序,并获得两个排序列表。 然后采用两个阈值c_{th}p_{th}来区分不同类型的特征。 我们将c大于c_{th}边缘特征的体素称为边缘特征,将p大于p_{th}的体素称为平面特征。 然后从每次扫描中选择具有最大cn_{F_e}个边缘特征。 还选择了具有最大p的非地面和地面平面特征,这两种类型的特征数分别为n_{F_p}n_{F_{gp}}。 此后将从所有扫描中提取的边缘和平面特征表示为F_eF_pF_{gp}。 这些功能的可视化示例在图2b–d中给出。

图片2

扫描到模型匹配与POU隐式表面表示

通过将簇激光扫描转化为稳定体素后, 我们将实现扫描至模型的匹配过程. 在我们的方法中, 地图由最后n个定位特征集 F_e, F_pF_{gp} 构成.

公式5

基于时间域k中涵盖平面几何特性和边缘细节的地图。 为了便于这些点更好地适应观察的曲面并适合特征体素地图的构建需求,在模型中我们采用了POU隐式曲面表示法。

A. 查找特征点对应

在当前扫描过程中,每个点都会被标记为其所属体素类型的属性。 在配准过程中( registration process),我们主要依据标签信息和欧几里得距离作为标准来建立地图体素与其当前特征点间的对应关系( correspondence)。 由于这种配准机制通过减少潜在候选对的数量来优化配准过程( optimization),从而提高了配准的精确度( precision)和计算效率( efficiency)。下面将详细阐述这一过程。
对于属于特征集F_e的每一个当前边缘点,在半径r_e所限定的球面区域内搜索满足一定条件的体素数量为n_e个。

公式6

对于每个对应的体素,我们找到一条边线作为当前边缘点的对应关系。 找到所有对应的边缘线后,我们可以得到当前边缘点在对应的边缘线上的投影点S_e。 然后,我们使用线性量c来确定S_e是否可以表示为边缘线。如果可以将S_e表示为边缘线,则将其视为当前边缘点的对应关系。 获得边缘特征对应关系后,我们计算从边缘特征点到其对应关系的距离。查找边缘线的过程和距离计算可以在[6]中找到。
对于特征集F_pF_{gp}中的每个当前平面点,我们分别在半径为r_p的球体空间内找到以下项的n_pn_{gp}个体素作为相应的体素。

公式7和公式8

随后

B.平面特征的POU隐式曲面表示

1.POU方法

POU方法的核心思路在于将数据划分为几个区域,并对每个区域的数据执行近似处理。随后通过平滑的本地权重将各个局部解组合起来,并保证这些权重在整体空间内求和为1。
具体而言,在每个像素中指定一个特定的平面片段作为特征点对应的基准面。
根据文献[7]中的描述可知,该基准面构造过程的具体实现方法。
我们可以计算出对应特征点与其相关联的基准面之间的距离d
接着我们把特征点x投影至由p_s定义的基准面:对于每个基面片s,其上对应的投射结果为p_{s_i} = x − d_in_i,其中n_is表示基准面上与该投射结果最接近的一组法线向量,并且是该投射位置处表面法向量的良好近似值。
值得注意的是,这里每一个基准面都可以被视作一个独立的子区域。
随后我们应用加权函数对各个子区域进行融合。

2.POU隐式表面表示

我们定义隐式曲面为函数I(x)在其值为零的地方形成的集合;同时这个函数也代表了从任何点x∈R^3到最近的该曲面的距离值。在此研究中采用了一种称为POU的显式几何表示方法;与文献[32]中所提出的基于POU的方法相似;具体来说,在每个时间步k, 我们通过映射矩阵M^k: R^3 \rightarrow R_+^4}来生成对应的特征点位置,并基于此计算出相应的近似距离值。

公式9

确定在平面补片s_i上的投影位置p_{s_i}及其法向量\vec{n}_{s_i}。为了简化处理过程,在这种情况下我们选择使用二次B样条基函数b(t)来构建权重函数。

公式10

其中c_{s_i}是平面贴片s_i的几何中心,R_{s_i} = \max\limits_{x∈s_i}\lVert x-c_{s_i}\rVert是平面贴片s_i的球形支撑半径。该函数与xc_{s_i}之间的距离成正比,与R_{s_i}成反比。这意味着c_{s_i}距离x越近,分配的权重就越高;形成平面补丁的点越分散,权重就越高。除了计算从特征点到模型表面的距离之外,还应该计算特征点x的投影点处的表面法线。在这项工作中,我们使用最接近x的点p_{s_{closet}}的法线作为投影点处的表面法线的近似值,与仅使用一个平面表示一个表面(可以是圆柱或球体等)的方法相比,我们采用具有各种平面度的多个局部平面来表示一个表面,该表面可以实现更高的精度并获得从特征点到其对应点的更精确的距离。图3展示了POU隐式表面。

图片3
3.运动估计

基于特征点与其对应点之间的距离的基础上定义了权重系数,并遵循双重规则对这些权重进行分配[7]。在两个相邻特征点之间存在一定的空间关系时,在其对应的权重要求下遵循特定的计算方式;然而,在两个相邻区域之间存在较大的空间关系差异时,则会对这种差异进行相应的处理;随后根据上述设定建立了一种新的计算模型;在这种情况下我们可以通过最小化总位移量来实现LiDAR运动估计

公式11

其中,在姿态变换T的作用下,
R与当前扫描相对应,
τ则代表平移矢量。
我们利用特征点与其对应关系的距离及权重,
并结合方程(11),
推导出特征点与相应模型之间的几何关系

公式12

其中f每一行都与一个特征点一一对应,并存储相应的距离信息。 最后,在LiDAR运动中应用Levenberg-Marquardt算法实现了[33]。 通过在当前扫描与其他最近n次扫描之间建立关联关系,并整合成功配准的n_m次结果来获得最终定位信息。 通过观察将当前 scan与其他历史scan进行配准处理能够有效抑制误差传播现象的发生。 在遇到异常情况时会对当前 scan与模型之间的相对转换规模施加限制性约束条件。 当发生错误时系统会终止当前 scan的数据处理并对后续配准操作产生轻微干扰作用。 在完成 scan与 model之间的转换计算后系统会对地图数据进行更新并补充最新的scan特征体素信息同时会删除不再相关的旧版本特征体素数据以确保数据的有效性和一致性

算法

全部评论 (0)

还没有任何评论哟~