Advertisement

【论文笔记】3D LiDAR-Based Global Localization Using Siamese Neural Network

阅读量:

论文笔记

学习笔记

学习笔记

~~~~~~~ 在本文基于从神经网络中学习到的降维扫描表示,提出了一种全局定位的解决方案,即首先实现位置识别,然后在全局先验图中进行度量姿态估计。具体来说,我们提出了一种使用人工统计和孪生网络的 3D 光检测和测距 (LiDAR) 点云半手工特征学习方法,将地点识别问题转化为相似性建模问题。此外,使用降维表示的传感器数据需要更少的存储空间并使搜索更容易。通过网络和全局姿态学习到的表示,在定位框架中构建和使用先验地图。在定位步骤中,粒子滤波器算法使用通过位置识别获得的仅位置观测值来实现精确的姿态估计。为了证明我们的位置识别和定位方法的有效性,KITTI 基准测试和我们的多会话数据集被用于与其他基于几何的算法进行比较。结果表明,本文提出的系统可以实现长期自治的高精度和效率。
本文中通过使用称为 LocNet 的深度网络解决全局定位问题,该网络学习 LiDAR 点云的表示并将表示嵌入到低维欧几里得空间中,通过应用 K 维树结构(KD-tree)进行高效匹配.训练数据集也可以自动注释,无需任何手动注释。如图 1 和图 2 所示,LocNet 的主干是 siamese 神经网络的一侧,siamese 网络旨在学习两个输入之间的相似性。为了降低学习的复杂度和训练数据量,本文在siamese网络之前添加了一个提取LiDAR扫描旋转不变特征的阶段,因此网络可以更轻量级,进一步提高效率。基于学习到的表示,在线扫描可以与地图匹配作为仅位置测量,这是全局坐标中姿势的二维位置。为了推导出相对于地图的姿态,本文提出了一个粒子滤波器来融合来自运动和由此产生的仅顺序位置测量的信息,最终在没有先验的情况下在地图中定位自治系统。本文的贡献如下:
1.提出了 3D 点云的半手工表示,它通过 LocNet 实现了旋转不变性。 可以在欧几里德空间中评估最终低维特征之间的相似性,保证地点识别的搜索效率。
2.提出了一个仅使用学习表示和匹配结果进行位置测量的全局定位框架。 利用高斯混合模型对地点识别结果的多个假设进行建模,在发生错误测量时成功实现全局定位。
3.对定位框架进行可观察性分析,为提议的系统添加理论基础和实践指南。 进行了彻底的实验以证明所提出的全局定位方法的有效性和效率。

系统概述

本系统架构如图所示主要包含两个关键组件:地图构建与定位主要流程如下首先在地图构建阶段一系列捕获的 LiDAR 扫描 {Si} 被输入到 LocNet 以便提取特征表示 { fi }这些特征信息随后用于在 KD 树的基础上实现快速匹配与此同时激光雷达扫描与 SLAM 系统协同工作完成对环境的地图构建与轨迹估计具体而言两次在同一位置获取的 LiDAR 扫描之间的相对位姿可通过 scan matching算法计算得到 [30]这些相对位姿构成了约束条件进而用于完成所有 LiDAR 扫描位姿的一致优化过程中涉及的关键技术和步骤包括但不仅限于特征提取 KD树构建 scan matching以及全局一致优化等环节最终将两个模块的输出整合形成一个基于全局一致图 M = {N, E} 的最终地图描述其中每个节点 ni 都包含了对应的 LiDAR 扫描数据 Si 全局姿态 xi ∈ SE(3)以及特征 fi 即 ni = {Si xi fi } ∈ N此外通过这种方式还可以生成完整的点云图 P

图片1

在定位环节中, 实时捕获一系列LiDAR扫描数据. 当前扫描数据St具有特征ft, 该特征通过利用LocNet算法进行提取. 这些特征被用作对KD树进行查询, 从而搜索到一组候选匹配对象. 结合位姿图中的邻接信息进一步筛选这些候选者, 得到Nc ∈ N的结果集合. 最后, 这些匹配成功的位姿{xi|ni ∈ Nc}被视为粒子滤波器的状态测量结果. 通过采用基于LiDAR的数据作为运动模型, 粒子滤波器能够递归融合来自运动学和测不准确的信息, 最终收敛到位姿分布的最佳估计值. 最后, 将这些姿态分布的期望值作为xt状态初始化的位置估计, 并将当前LiDAR扫描数据St与点云图P进行精确对齐. 总体而言, 该定位流程实现了从二维到三维姿态转换, 并降低了从零开始进行精确姿态估计所面临的复杂性.

3D 激光雷达扫描的特征学习

从实验结果可以看出,在映射与定位阶段的设计中引入了特征提取模块LocNet。该模块基于生成特征对相似性的评估起到关键作用,在整个系统性能提升方面具有重要意义。为了使在同一位置捕获的扫描能够得到匹配并实现精确对齐,在系统设计中采用了旋转和平移微小变化下的不变特征求解方案的同时也在一定程度上简化了地图数据结构以减少存储负担和计算开销等挑战问题为此我们提出了一种基于神经网络的学习方法来提取3D LiDAR扫描特征如图2所示该方案采用半自动化的特征学习架构并将提取到的特征嵌入到欧几里得空间中从而显著减少了网络模型的整体复杂度以及相似性评估所需计算资源同时提升了整体算法运行效率在此过程中我们采用自监督学习策略对模型参数进行优化训练最终使得该方法在自动标注的数据集上取得了优异的结果不仅大幅降低了人工标注的工作量而且显著减少了计算资源的需求

图片2

在航向旋转方面具有不变性的手工制作特征包括 RrR_r 和 RΔrR_{Δr}。然而,在地面平整度所导致的侧倾、俯仰偏差以及垂直运动方面,这些特征可能表现出高度敏感性。一种直观的情况是,在两次 LiDAR 扫描发生在同一位置并具有相同航向但略有不同高度时(如第一次扫描中环 1 扫描的物体对应于第二次扫描中的环 2),可以通过引入环偏差来计算方差。这种差异则要求采用更为复杂的相似性评估方法(如相关性),因而计算时间会有所增加 [7]。此外,在横滚与俯仰偏差的影响下,方差的变化不仅限于环偏差的变化;环境中的某些半静态物体(例如停放中的汽车)也会带来变化,在这种情况下由于测绘会话与定位会话的时间不一致而产生的变化无法完全避免。为了应对这些问题,在此问题的基础上深度学习被用来进一步提高性能

1.头部不变表示

一种高效的方法是通过大量数据训练大型网络来捕获旋转和平移不变性这一关键特性,在方法设计中采用了大量的数据训练策略。
然而由于缺乏像视觉领域那样经过预训练的网络资源这种方法并不适用于轻量级应用。
为了简化学习过程我们在处理扫描数据前降低了其方差水平。
基于实际应用需求我们发现与车辆运动相关的显著差异主要体现在旋转方向上的航向变化以及水平运动方向上的平移变化上。
值得注意的是滚动、俯仰以及垂直运动方向上的方差受地面平面平整度的影响较为明显。
具体而言当车辆在同一位置旋转时激光雷达测得的距离值始终保持恒定。
基于此我们设计了一种基于固定方位角的手工特征用于后续特征提取环节。
为了便于理解我们将扫描Si下的下标i省略掉了。
其中S中的每个点的位置由球坐标系参数(r θ ϕ)确定具体来说r代表传感器到激光点直线ll的距离θ是天顶方向与直线ll至Z轴的角度ϕ则是该直线在传感器框架xy平面投影所对应的方位角。
考虑到一般的3D LiDAR传感器由于其扫描环的不同θ值通常是离散分布的因此整个扫描结果集S可以划分为多个测量环记为Sk∈S其中k为各测量环索引编号。
在每一个测量环中按逆时针顺序排列的是具有相同方位角ϕ的所有点记为pk j其中j为方位角对应的索引编号。
需要注意的是当LiDAR设备连接至自主系统时其测得的方位角能够反映系统的行驶方向因此可以通过构建具有固定方位角ϕ的手势特征来实现对系统航向信息的有效提取。
对于每个环Sk中的连续两个激光点pk j和pk j−1它们之间的二维距离计算公式为

公式1

其中r表示激光点的距离值。本节探讨了构建该特征的两种方案。基于训练集数据,在给定的r范围内[ rmin, rmax ]内确定所有有效的区间集合;同时考虑与差分相关的区间IΔ_r=[Δ_rmin, Δ_rmax]。在此情况下设定示例范围时,在整个区间内均匀划分b个子区间。

在这里插入图片描述

因此每个段都有一个间隔

公式3

其中 m 代表该区间的索引变量。当前,在扫描中环 SkS^k 中的所有点都可以被映射至相应的区间 IrmI_r^m 中以构建基于该区域范围的直方图。

公式4

其中 hmh_m 的条目定义为

公式5

该系统中用于统计同一类别的计数单元中的点数量。通过类似的方法, 可以将指定范围内的差分值分布情况构建为 HΔrkH_{Δr}^k 表示形式。
假设输入特征图是一个列向量, 我们会将 C 个特征图 H_r^k 或者 H_{Δr}^k 按照特定堆叠方式组织起来, 其中 C 表示通道的数量, 如 Velodyne VLP-16 设备具有 16 个通道, 而 Velodyne HDL-64E 则拥有 64 个通道。
具体堆叠方式如后文所述。
其中, C 表示通道的数量, 具体来说, 如 Velodyne VLP-16 设备具有 16 个通道, 或者像 Velodyne HDL-64E 这样的设备拥有 64 个通道。

公式6,7

Rr 和 RΔr 是扫描 S 的单通道特征图,并且具有 C×b 维度。当自动驾驶系统装有 LiDAR 且在同一位置旋转方向时(即转向),这种表示特性不会发生改变。尽管如此,在方向变化带来的影响下(如车辆转向),这种方法仍能维持一定的稳定性。此外,在处理这些量(即范围及其微分)时(如离散化处理),通过将连续值转换为离散值的方式实现了轻微的水平平移不变性。例如,在LiDAR传感器未安装于系统旋转中心的位置时(即非对称安装),由于传感器的位置不同会导致对同一物体测量值的小幅偏差;然而在这种情况下(如非对称配置),直方图可能会保留这一特性

2.特征学习和嵌入

~~~~~~~人工制造的特征 Rr 或 RΔr 在航向旋转方面具有不变性。然而,在地面平整度引起的侧倾、俯仰偏差以及垂直运动方面这些特性可能非常敏感。一种直观的情况是:当两次 LiDAR 扫描在同一位置、同一航向但高度略有不同时(即两次扫描在同一位置、同一航向但高度略有不同),可以通过环偏差引入方差(例如第一次扫描中环 1 扫描的物体对应于第二次扫描中的环 2)。因此这种差异需要更为复杂的相似性评估方法(如相关性)从而导致评估过程更加耗时 [7]。此外环偏差与环偏差之间也可以耦合而不仅仅是单一环偏差之间的关系。环境中的一些半静态物体例如停放中的汽车也会带来变化这种环境变化无法避免因为测绘会话与定位会话的时间存在差异为了解决这些问题深度学习被用于进一步提升性能。
如图 2 所示我们采用 Rr 或 RΔr 作为网络输入该网络由两个卷积层和一个全连接层组成采用了 Siamese 架构 [31] 和对比损失 [32] 来训练 LocNet 的可学习部分如图 2所示这两个 LocNet 被用作 Siamese 网络中的 Side 1 和 Side 2 并将对比损失作为学习目标两侧共享相同的权重我们将其可学习的卷积神经网络表示为 G 使用 R 表示 Rr 或 RΔr 我们有

公式8
图片2

其中 W 是学习参数。 对比损失是

公式9
公式10

其中 Y 为标签变量,在本系统中定义 Y=1 表示扫描操作 S1 和 S2 在同一位置捕获目标物体;而当 Y=0 时,则表示两者不在同一位置。边际影响程度 λ 会直接影响不同特征对在整个训练过程中的重要性分配。具体而言,在每一轮训练过程中所需的时间长度与边际影响程度呈正相关关系。基于实验结果分析,在本研究中我们发现大多数不同的特征对与相似特征对之间存在较大程度的难以区分性;因此为了提高模型性能效果最佳的方式是将 λ 参数设置为一个相对较大的初始值以强化相似特征对的区分能力。对比损失函数的主要目标在于通过优化过程使得相似特征对之间的距离(即 DW 值)得以减小;同时尽可能增大不同特征对之间的距离差异从而提升模型的整体识别性能。
经过网络参数优化后系统运行效率达到最佳状态;在测试阶段假设所有待检测目标均与查询框完全一致则系统将标记结果设为 Y=1 此时对比损失函数的具体计算公式如下所示:

公式11

直观上而言,在假设成立的情况下(即假设正确时),其对比损失估计通常会非常小。相反,在训练过程中仅有原始对比损失中的第二部分被最小化的情况下(即假设不成立时),其估计值会显著增大。基于此观察,我们可以将(11)式视为一种衡量样本间相似性的度量 Sim 的形式。

公式12

这一结果表明,在学习过程中所考虑的相似度指标本质上等同于两个特征向量之间的欧几里得距离。基于此观察,在实现实时性能方面, 该系统采用了将LiDAR数据嵌入到低维欧几里得特征空间中的策略。值得注意的是, 在池化操作下引入的表示特性具有局部平移不变性。具体而言, 在这种情况下, 在池化后的图像R中其最大值可能会保持不变。这种特性主要与传感器输出过程中的滚动、俯仰以及垂直方向上的偏差有关, 因此在学习到的特征空间中需要更高的区分能力以应对这些变化。

3.无需人工标注的训练

在神经网络的传统训练阶段中使用siamese架构时需要为三元组(S1, S2, Y)进行人工标注。这一过程的人力投入非常巨大。基于全局扫描匹配的技术框架下,其中数据来源于环境中的自主移动系统。为此开发了一种无需人工干预的无监督样例标注方法。通过多会话中的3D LiDAR扫描数据实现了统一空间中的配准,在此过程中生成了位姿{xi}集合。当两个LiDAR扫描(例如S1与S2)在同一地点采集时被视为正样本(S1,S2,1),反之若两者之间的相对姿态超过阈值ρ则被视为负样本(S1,S2,0)。从而生成了自动分类后的训练集。

公式13

该过程在车辆行驶过程中生成了大量数据,并具有较高的效率和快速性特性,在训练神经网络方面完全符合条件。显而易见,在常规数据集中负样本数量远远超过正样本数量;这是因为只有当车辆访问过之前访问过的地方时才会出现正样本这一现象。因此,在训练过程中我们剔除了大量负样本用于实现数据平衡目的;在本文中采用随机梯度下降法并附加动量项来进行网络训练。

特征和指标地图创建

利用LiDAR传感器进行环境地图绘制时会获取一系列激光扫描与里程计数据;借助SLAM技术和其它映射方法的应用,在地图坐标系中对每个LiDAR扫描进行全球二维位姿赋值;此步骤也被用于自动数据标注过程;由此可得的地图构建基于全局一致模型M={N,E}

公式14

为了提高查询扫描与地图中相似 scan 的匹配效率,在特征空间中构建了一个 KD 树结构,并使搜索复杂度从 O(|M|) 升级到 O(log |M|)。通过将每个 scan Si 通过 xi 转换至地图坐标系,并通过对齐激光 scan 数据构建全局一致的度量点云图 P。与 M 不同的是一个度量点云图 P,它用于几何对齐以确定在地图中的精确姿态。度量点云图 P 和拓扑特征图 M 之间通过 scan xi 的全局位姿建立一一对应关系。当查询 scan St 与特征图 M 中的一个节点匹配时,在以 xi 为中心的位置范围内注入度量点云 P 图像。这种注入范围包括平移、俯仰和滚转的小幅度不确定性,在航向固定不变的情况下无法提供航向信息

全局定位

~~~~~~~贝叶斯递归式估计器被设计用于在地图上确定车辆的位置状态,并将当前二维姿态的状态分布转化为二维概率密度函数的形式表示

公式15

其中 Z₁:t⁺¹ = {z₁, ⋯, zₜ⁺¹},
η 被定义为归一化因子,
p(x_{t+1}|x_t) 表示运动模型,
p(z_{t+1}|x_{t+1}) 表示测量模型.
粒子滤波器是一种基于贝叶斯递归估计的技术.
基于蒙特卡罗定位理论[28],
我们将其概率分布定义为

公式16

然后通过一组从提议分布中采样的加权样本来近似当前姿势,

公式19

在全局定位场景中,在线定位系统通常假设初始姿态p(x₀)在整个地图空间上呈现均匀分布特性。运动学模型基于LiDAR odometry数据生成预测位姿值,在此过程中需应用ICP算法对齐前后扫描数据以完成位姿估计任务。观测变量zt+1来源于地图中的匹配扫描所对应的姿态集合{xi};为了建模所有匹配结果的空间分布特征,我们采用了高斯混合模型(GMM)作为主要分析工具

公式20

其中混合系数 πi 赋予不同权重至各分模型中,在概率密度函数中体现其重要性。 当当前查询扫描可能对应地图中多处位置时,在概率框架下 GMM 可实现多目标联合检测与状态估计;该模型可同时建模多组潜在状态并推导相应的条件概率分布;在获取当前扫描数据后,则需将其转换为特征向量以便后续计算处理。

公式21

然后找到候选集

公式22

并且分配的姿势属于这个集合,如下所示:

公式23

在上文中提到,在估计的目标位置 xt+1 周围存在一个未包含方向信息的区域内。 因此,在这种情况下,我们采用高斯分布模型进行描述

公式24

定义 dp 为 xi 在其 x-y 平面上与 xt+1 投影后的间距。考虑到地表在局部区域呈现平缓特性,在特征匹配过程中无法通过滚动、俯仰或高度变化来区分不同情况。测量模型主要关注水平运动带来的不确定性,在此分析阶段能够有效地区分不同状态。这一过程不仅降低了状态空间的有效维度,并进一步优化了用于近似姿势分布所需粒子的数量。在确定混合系数 πi 的过程中,默认参考当前扫描与地图扫描间的相似度指标 Sim;该系数被赋值为归一化后的相似度值以确保概率密度的有效性。

公式25

其中κ是控制相似度尺度的系数。 该模型遵循这样一个事实,即当两个地方的周围环境更相似时,它们之间的距离更小。 另一方面,当几个地方的环境相似时,假设通过πi更平衡,比单模态分布更接近真实的不确定性。 每个假设的方差是在训练阶段确定的。 对于映射 M 中的节点 xi,其对应的方差 i 由后续步骤分配。 首先,地图中的其他扫描按到该节点的距离排序。 然后,选择相似度高于 ρ 的第一个扫描,扫描附加的位姿表示为 x1→i。 最后,将 i 设置为 x1→i 和 xi 之间的 dp,由因子 γ 缩放,可以调整平滑度。
当粒子的多样性较低时,对粒子集采用重采样步骤,避免只有几个粒子被分配高权重。 粒子被统一分配给匹配步骤提出的多个假设,以减少对当前测量的依赖,以便在出现不正确的收敛时可以快速切换到更好的解决方案。 重新采样后,所有粒子的权重被重新初始化为相等的值 w1 = w2 = 。 . . = wK ,其中 K 是粒子数。
此外,由于测量模型具有较大的不确定性,因此该过程可能不会导致非常准确的位姿估计。 考虑到在地面上的自主系统,我们直接将地图中匹配扫描的俯仰、滚动和高度分配给当前位姿,因为这些值应该是局部平滑的。 为了进一步改进估计,我们在粒子集中在一个姿势时进行ICP,这通过粒子的方差和粒子的权重来反映。 这意味着当收敛发生时,粒子滤波器提供的位姿是 ICP 的一个很好的初始值。 当 ICP 将当前扫描与具有高内点和小距离的度量图 P 对齐时,意味着找到了令人满意的全局 3D 姿态。 在后面的步骤中,可以停止粒子滤波,也可以更多的步骤来测试ICP结果与粒子滤波结果的一致性,从而保证更高的置信度。

可借鉴的地方:

  1. 在全局定位之前,在此之前先执行位置识别步骤,在此之后再实施粒子滤波。
  2. 在后续的位置识别过程中可以考虑优化匹配算法。
  3. 建议将粒子收敛后的姿态配置作为ICP算法的初始估计值。

1.可观察性

与之前采用全局定位的方法相比,在测量模型中对姿势的约束存在显著差异。我们的测量模型仅约束姿势的部分维度(主要涉及位置信息),其余维度则未进行限制或约束。通过从匹配的地图中提取俯仰角、滚转角以及高度数据来增强系统的精确度,在这一过程中这些参数被视为可观察且具有较高的可信度。基于此假设条件下的唯一变量——航向的可观察性——使得系统得以简化为独轮车模型的形式以便后续分析使用。值得注意的是,在这一过程中为了便于后续分析我们暂时采用了简化的符号体系其中x和y分别表示系统的纵向位置坐标而h则代表系统的航向角参数。连续时间状态转移方程则表述为

公式26,27,28

其中函数 f(x, y, θ) 等于零;运动 u 的速度和角速度分别为 v 和 ω。对于所定义的系统而言,在其上的 Lie 导数即为此处所讨论的内容。

公式29
公式30,31,32

其中 g1 和 g2 分别表示 g(x, y, θ) 中的第一列和第二列。 这些向量跨越观察空间

公式33

那么我们有 O 的梯度为

公式34

满足rank(dO)=3的具体而言,则表示状态空间的维度达到了三维空间。基于可观察性等级条件[33]这一前提假设, 单轮车模型的状态变量在该条件下确实表现出良好的可观察性特征。由此可知, 利用仅基于位置信息的测量数据, 我们能够最终确定系统的航向角度, 这一结果直接表明了所提出的滤波器设计的有效性和其在ICP配准过程中的重要应用价值。

值得注意的是, 控制信号的形式具有特殊性质: 在系统直线运动过程中, 角速度始终保持为零, 此时系统的可观测性特性并未发生改变。然而, 当系统启动place操作(即运动速度降为零)时, 此时rank(dO)<3, 因此失去了航向角方向上的可观测性特征。这两个结论在附录中给出了详细的证明过程: 根据上述理论分析可知, 如果系统长期处于静止状态而不断重复place操作的话, 它就根本无法实现自身定位功能; 这种情况在实际应用中显然是不可能实现的。综上所述, 所提出的全局定位算法能够在绝大多数情况下有效运行

实验结果

地图匹配性能

在实验过程中采用了两个数据集作为研究基础。其中一个是KITTI数据集[34](Velodyne HDL-64E LiDAR扫描),它提供了地面实况环境下的完整LiDAR扫描过程以及DGPS收集位置信息,在这一环境下进行了多次循环行驶测试以获取扫描数据。该数据集中包含一辆车辆在各种复杂环境下循环行驶所生成的所有扫描信息,并可据此评估所提出的LocNet相似性建模的有效性。另一个YQ数据集[35]基于三天内于大学校园内运行测试收集而来(Velodyne VLP-16 LiDAR扫描),如图3所示展示了其空间分布情况。在同一场景下(KITTI场景),环境表现出微小的变化趋势,在我们的数据集中则呈现典型的半静态对象特性(例如停车状态),这种特性在实际应用中更为贴近现实需求条件下的表现更为理想化。
所有实验均在配备Intel i5-5200U 2.20GHz处理器并拥有8G RAM的笔记本电脑上完成[36]。该系统采用C++与Matlab编程实现整体算法框架,在深度神经网络构建方面基于Caffe框架进行了优化开发。

表2

所有方法在YOLO数据集中的表现均不及KITTI数据集中的表现。其主要原因在于制图对话与定位对话分别在不同日期进行采集,并因此带来了环境变化具有一定的静态性。此外,YOLO数据集中包含更多的非结构化物体,如树木和灌木,其提供的确切几何信息有限。另一个原因在于YOLO采用了LiDAR传感器,其中环状区域的分辨率显著低于KITTI,这可能导致其他方法中的表面法向量或投影计算受到影响,从而使YOLO与KITTI数据集的表现存在差异。这一结果表明,当适应不同类型的传感器时,人工调整特征参数是必要的,而我们的系统可以在无需人工干预的情况下实现自适应训练,从而始终保持最佳性能水平

图片5
  1. Finally, LocNet-r demonstrated slightly better performance on two datasets compared to LocNet-Δr. The latter established a differential representation for the former prior to the learning stage, thereby losing absolute values. Partly due to its inability to recover absolute values during the learning phase, this slight advantage may be attributed to its capability in extracting differential information.

全局定位性能

~~~~~~~根据地图匹配的结果,然后对系统进行 YQ 数据集的全局定位任务测试。 给定YQ Day 3-1的测试会话数据,我们随机选择一个时间步作为一个部分的起点,车辆位姿的分布在整个地图中被统一初始化。 然后车辆继续移动并收集传入的 LiDAR 帧,这些帧被馈送到系统以定位车辆。 记录地面实况与配准估计姿态之间的位置误差和航向误差,以证明方法的收敛性。 整个过程重复50次进行性能评估。 我们有三种粒子滤波器模型来进行比较:
1.SG:单高斯测量模型,只考虑给出最佳相似度的匹配结果,通常应用于位置和航向都可以测量的场景。
2.GMM:建议的基于 GMM (20) 的测量模型,将匹配结果建模为多个高斯分布。 在实验中,GMM 的系数由匹配的相似性度量(25)确定。
3.GMM-k:模型类似于GMM。 但是每次都会在测量模型中考虑前 k 个匹配候选,从而导致恒定数量的高斯。
定位误差的演化曲线如图7所示。位置和航向误差都收敛到一个很小的范围内,从而可以应用ICP来估计地图中系统的准确位姿,实现全局定位。该结果验证了姿态的可观察性分析是合理的,即使只给出了位置测量值。最终使用这三个模型的位置误差收敛到零。主要原因是在匹配结果中直接测量位置。用于估计位置的信息对于所有方法都是等效的。然而,对于航向误差曲线,由于可能不正确的测量,SG 下降明显慢于多假设方法。具体而言,航向是通过聚合仅连续位置测量值来估计的。对于SG,当最佳匹配结果不正确时,序列信息丢失,而对于GMM和GMM-k,如果正确结果小于阈值,或排在top-k,则仍将其考虑在测量中,为航向估计提供信息。最后,提出的 GMM 略好于 GMM-k,因为常数 top-k 倾向于在测量中涉及更多的不正确匹配,这可能会干扰滤波器推导出正确的估计,而 GMM 是 SG 和 GMM 之间的平衡-k 考虑更正确的匹配结果,并减少不正确的匹配结果。

图片7

结论

我们开发了一个全局定位系统(GLS),其输入数据来自三维LiDAR扫描。该系统基于仅依赖位置信息的粒子滤波器实现。关键测量模型由我们的深度神经网络LocNet实现——一种能够从欧几里德空间中的LiDAR扫描中提取低维特征表示的技术——从而实现了高效的特征搜索过程。在实验中,在准确性和效率两个关键指标上均取得了最优结果,在与现有方法进行对比后发现,在复杂度与性能之间达到了良好的平衡点。随后,在全局定位与姿态估计任务中对系统的进行了全面验证,并通过动态测试评估了系统的实时性表现如何?最后评估系统的计算成本表现如何?未来的研究方向包括将语义信息融入我们的系统架构以提高鲁棒性

全部评论 (0)

还没有任何评论哟~