【论文笔记】A Simulation-based End-to-End Learning Framework for Evidential Occupancy Grid Mapping
原文链接:https://ieeexplore.ieee.org/document/9575715/
I. 引言
相较于3D目标检测而言,在进行OGM预测任务时,并不需要考虑物体的具体类别。为了实现确定占用状态的目的,则必须依赖逆传感器模型(ISM)。经典方法主要适用于静态且较为平坦的场景,在此条件下其性能得到了充分验证。然而由于这种限制性假设的存在,在复杂的真实环境中难以得到有效应用。因此研究者们转而开发出基于深度神经网络的新方法,并将其命名为深度ISM
生成深度ISM模型需要大量的训练数据。一种方法是采用跨模态技术,在获取图像的同时也能捕获环境特征信息以提高模型性能的基础上进行优化与改进。其中一个问题在于所使用的数据来源于对激光雷达信号的估计,在实际应用中可能会引入较大的误差影响结果准确性。另一种常见做法是通过人工标注的方式来构建训练集虽然这种方式能够保证数据质量但需要投入巨大的人力资源与时间成本难以大规模推广这种方法效率较低难以满足实时性要求需求不高的话可能还可以考虑其他方案例如利用现有的仿真平台进行模拟实验从而能够获得接近真实场景并带有自动标注的真实模拟数据
此外,在对感知算法运行机制深入研究的基础上,需要对感知算法中不确定因素进行评估测定,并采用深度神经网络来计算出预测结果的信任度。
II. 贡献
该文中介绍了一种端到端的学习架构,在该架构下通过合成数据对逆激光雷达传感器模型进行深度学习训练。文中首先阐述了训练样本生成的方法,并指出其中包含了激光雷达产生的点云数据以及真实场景中的证据信息通过OGM进行标注。随后引入了一种名为EPH的证据预测头来扩展PointPillars架构,并其目的是为了实现对相应区域的 OGCM 的预测。
III. 背景
A. 占用网格图
OGM将车辆环境划分为基于占用信息的离散单元格。在时间k时点上, 每个单元格的状态可视为二元随机变量o_k\in\{O,F\}, 其中O代表占用车道, F代表空闲通道. 通过当前测量数据z_k结合ISM模型可以获得该时刻单元格状态为占用车道的概率p_k(o_k|z_k). 常用二元贝叶斯滤波框架从距离测量数据构建OGM模型. 但该方法基于马尔可夫假设, 即认为占有态与时间无关且不随时间变化; 此外, 对于被遮挡导致无法直接观测的状态单元, 或者具有接近0.5概率的状态单元, 也难以确切判断其状态(证据理论可为此提供解决方案).
B. 逆传感器模型
基于几何模型的ISM方法 通过分析测量与传感器之间的单元格关系来评估单元格占用概率分布的情况,并考虑到传感器存在的误差影响。同时可以通过上一个时间段内的有机环境模型(OGM)数据来降低当前时间段内有机环境模型(OGM)数据中的不确定性。
深度ISM 则采用深度神经网络作为基础模型,并且通常会采用适当的传感器数据张量表示方法(例如利用BEV图像)。
C. 证据理论
DST(也可称为Belief Theory)可被视为贝叶斯理论的一种扩展,并能够明确地考虑不确定性。通过应用DST方法论,在识别能力框架\Theta中将信念质量分配给其子集上。在证据OGM的具体实现中,则涵盖了所有可能且互斥的状态(即状态为"占用"或"空闲"),即\Theta=\{F,O\}。具体而言,在信念质量m的具体实现中,则定义了从幂集2^\Theta映射至实数域的一个函数:
m:2^\Theta\rightarrow 1\\ m(\emptyset)=0\\ \sum_{A\in2^\Theta}m(A)=1
其中m(O)代表单元格处于被占用状态的证据量,而m(F)则代表单元格处于空的状态下的证据量。具体而言,在这种情况下,
m(\Theta)与m(\emptyset)分别表示没有证据支持的情况以及不可能存在的输出结果。
该主观逻辑(SL)对应于不确定性推理的数学框架。在DST中,通过主信度函数b_A和不确定度函数u所定义的质量分配m(A)与主观观点之间存在一一对应关系:
对于所有属于\Theta的事件A来说,
b_A = m(A), 并且
u = m(\Theta), 同时满足:
\sum_{A \in \Theta} b_A + u = 1
主观观点与狄利克雷概率密度函数(PDF)对应于Dirichlet分布的概率密度函数:$Dir(p,\alpha)=\frac{1}{B(\alpha)}\prod_{A\in \Theta}p_A^{\alpha_A-1}$ 其中先验概率为$p = \{p_A | A ∈ Θ, ∑_{A ∈ Θ} p_A = 1, 0 ≤ p_A ≤ 1 \}$;参数为$\alpha = \{\alpha_A | A ∈ Θ \}$;可将多元函数$B$表示为使用gamma函数Γ的形式:
B(α) = \frac{∏{A ∈ Θ} Γ(α_A)}{Γ(∑{A ∈ Θ} α_Α)}
当满足条件$e_A>1$且属于集合$\Theta$时(其中$A\in\Theta$),该证据可以被表示为狄利克雷概率密度函数(PDF)的一个参数组合以及相应的类别数量。具体而言,在这种情况下(其中狄利克雷分布的长度参数定义为$S=\sum_{A\in\Theta}\alpha_A$),对应的主观观点$(b, u)$可以通过以下方式来计算:其中$\alpha_A = e_A + 1 \quad (A \in \Theta)$;而$b_A = \frac{e_A}{S}$;最后地,则有先验强度因子为$u = \frac{K}{S}$(其中$K=|\Theta|$)。 该种方法表明, 可以建立模型来估计狄利克雷分布参数α, 以表征分类任务的不确定性. 其中, 损失函数采用均方误差形式. 其中网格$i$被定义为其对应的网络参数量,并且其对应的类别概率估计值$\hat p_i$表示该区域单元格的空间位置特征向量与网络权重矩阵之间关系的度量值。在分类过程中,在于将输入图像划分为多个区域单元格,并通过计算每个区域单元格与其邻居之间的相似性程度来确定最终的分类结果。对于每个区域单元格来说,在于将输入图像划分为多个区域单元格,并通过计算每个区域单元格与其邻居之间的相似性程度来确定最终的分类结果。对于每个区域单元格来说,在于将输入图像划分为多个区域单元格,并通过计算每个区域单元格与其邻居之间的相似性程度来确定最终的分类结果。 ## IV. 学习框架 ### A. 网络结构 本文使用PointPillars,将其检测头替换为基于2D卷积+ReLU的占用预测头(2D占用),输出通道数为2,对应$e_{i,A},A\in\Theta=\{F,O\}$。将预测证据转化为狄利克雷PDF的参数$\hat\alpha_{i,A}$,并可进一步得到概率$\hat p_{i,A}=\hat\alpha_{i,A}/S_i$。本文基于式(1)的简化损失函数如下: $L_i(w)=\mathbb E[y^2_{i,F}-2y_{i,F}p_{i,F}+p^2_{i,F}]+\mathbb E[y^2_{i,O}-2y_{i,O}p_{i,O}+p^2_{i,O}]\\ =(y_{i,F}-\hat p_{i,F})^2+\frac{\hat p_{i,F}(1-\hat p_{i,F})}{S_i+1}+(y_{i,O}-\hat p_{i,O})^2+\frac{\hat p_{i,O}(1-\hat p_{i,O})}{S_i+1}$ 本文引入了一个基于当前训练轮数$t$计算的影响因数$\lambda_t=\min(1.0,t/10)$的KL散度项来扩展损失函数。其中变量$t$表示当前训练轮数。该正则化项通过惩罚狄利克雷分布参数对应于无先验知识的情况(即$\alpha_i=1$)来减少冲突证据的影响。总损失函数为: $L(w)=\sum_{i=1}^NL_i(w)+\lambda_tKL[Dir(p_i|\tilde\alpha_i)||Dir(p_i|1)]$ 其中$\tild{α}_i = y_i + (1 - y_i) · \tanh β · \tanh β · \tanh β$ ,其KL散度项由Γ(Gamma)和ψ(digamma)两个函数共同构成: 其KL散度项由Γ(Gamma)和ψ(digamma)两个函数共同构成:
KL[Dir(p_i|\tild{α}_i)||Dir(p_i|1)] = \
log Γ(α̃_{{ i,F }} + α̃_{{ i,O }})/(Γ(2) Γ(α̃_{{ i,F }} ) Γ(α̃_{{ i,O }} )) ) \
- (α̃_{{ i,F }} - 1)(ψ(α̃_{{ i,F }} ) - ψ(α̃_{{ i,F }} + α̃_{{ i,O }} )) \
- (α̃_{{ i,O }} - 1)(ψ(α̃_{{ i,O }} ) - ψ(α̃_{{ i,F }} + α̃_{{ i,O }} ))
该损失函数通过估计单元格的证据质量来模拟真实的证据水平,并通过提高占用单元格的权重来弥补其在表达上的不足。 ### B. 训练数据 本文基于32线激光雷达进行仿真数据实验(左图)。此外,在3000线HD激光雷达实验的基础上(中图),我们构建了真实OGM数据集。当处理某个实际物体时,如果其具有超过特定数量反射特征,则将所有被覆盖的单元格标记为被占用区域,并将地面单元格标记为空。  ### C.数据增广 由于自行车两边经常被占用车道,在这种情况下深度ISM算法在深度域的表现欠佳。因此为了改善这一问题 本文提出采用全局旋转增强的方法进行改进 ## VI. 结果与讨论 ### A. 在合成数据上的评估 研究表明,在应用几何模型的基础上使用ISM算法能够识别出更多数量的未知网格,并且经过计算发现,在评估指标方面(如平均信念质量和KL散度)均低于本文的方法 ### B. 在真实世界数据上的评估 研究结果表明,在真实世界数据上的性能表现较差。然而,在多数不带反射现象的单元格中仍能准确预测其状态。
