Advertisement

智能驾驶~重感知,轻地图

阅读量:

在2023年智驾领域备受关注的话题中,“重感知,轻地图”方案亦被称作“无图”方案(其中“无图”特指不依赖于预先加载的离线高精度地图数据)。相比于传统基于离线建图和实时在线高精度定位的技术需求有所降低,“重感知”的方式反而提升了系统的灵活性与适应性。然而这一变革却引发了诸多讨论:是否会导致许多从事SLAM技术的相关从业者感到担忧:是否会因此而被淘汰?对此问题的未来发展趋势仍存在诸多疑虑。本文旨在通过调研与思考来探讨这一问题

一 从智驾系统框架说起

智驾系统划分为规划控制、地图定位以及实时感知三大核心模块。其中实时感知模块则负责采集并传递车辆周围动态变化的状态信息。这不仅有助于规划控制行为决策的有效性,在动态环境中确保执行动作时能够依据最新情况做出及时调整。若仅考虑局部区域内的车辆自主运动,并且假设在线感知能力较强的情况下,则可暂时忽略地图定位模块的作用;但就当前智能驾驶系统的经典技术架构而言,在线定位与环境建模仍是不可或缺的关键环节之一。深入理解规划控制与地图定位之间的相互依赖关系,则是解析基于"重感知弱定位"策略下的SLAM技术需求这一问题之关键所在。

智驾系统框架[1]

二 规控对地图和定位的需求

按照规划管理传统的子模块结构遵循规划管理

早上开车前往公司时,在上车后首先要做的就是启动并调用车载语音助手来引导至目标地点。语音助手会调用高德地图这一可用的导航工具,并展示多条可选路线供你选择。(全局路径规划)

沿导航路线前行至公司方位时

在上述变道转换过程中,您不自觉地朝着左侧车道前方某一大致位置移动。这种移动基于自车与该大致位置的距离与方位,并伴随持续调整油门大小及左转向的角度以最终确定并完成变道的动作。在此过程中,请您注意我们实际上构建了一条从当前车辆位置至左侧目标点的局部运动轨迹,并将这一局部轨迹跟踪问题归类为局部规划或运动控制模块。该模块输出一系列油门大小及转向指令,并由运动控制器根据这些指令执行相应的控制动作以描绘出一条流畅且动态的转换路径线。

规控系统框架[1]

为了完成上述自动驾驶任务所需的目标设定与实现过程,在此过程中产生了规划控制模块对地图定位的需求。其中,在全球路径规划中只需使用规格略低于SD级别的SD地图(如高德等手机导航级别)以及米级精度的全球定位技术。以便完成从起点(由全局定位模块提供)到终点(在SD地图中指定)的整体路线规划。针对行为决策与局部规划模块而言,则需获取关于道路环境更为详细、精确的信息。如果系统的感知能力较强,则可以直接在线获取所需信息;但如果早期感知能力较弱,则需利用额外高精度设备进行离线采集,并通过离线计算保存这些数据的方式生成HDMap

对于离线高精地图的使用进行了可控,并形成了对高精地图定位的需求,并称为矢量地图定位。构建了一个由各种道路元素组成的虚拟世界的过程实际上是在这个虚拟世界中进行决策控制。而矢量地图定位则实现了虚拟地图世界与真实世界的映射关系以确保规控在实际应用中的准确性与可靠性。具体而言矢量地图定位通过结合感知系统提供的语义信息如车道线路灯杆等以及GNSS组合导航给出的初始位置信息与离线高精地图中的对应语义数据进行匹配运算从而实现了位置估计与环境感知功能由此可见离线高精地图与矢量定位之间存在密切依赖关系两者相互依存才能发挥出最佳效果

规控各个子模块对地图和定位的需求[1]

三 重感知轻地图的技术趋势

高精地图的不足

通过以上分析可以看出,在实时感知能力不足的情况下(即无法即时获取周围环境信息),离线高清地图在弥补这一缺陷方面发挥着重要作用。然而该技术面临一个显著的问题在于频繁更新带来的维护成本上升。随着道路结构的变化出现(如弯道数量增多或路面状况变化),高精度地图需要相应地进行持续更新以维持其准确性与完整性)。当前智能驾驶系统通常将场景划分为高速公路路段、城市区域以及低速区域三大类型。作为智能驾驶技术首个实际应用领域,在中国境内行驶的高速公路总里程约为35万公里[6]。由于路面状况良好且管理较为完善,在实际使用过程中变更率较低(即车辆变更车道或路线频率较低)。通过与多家图商合作的方式向所有业务方提供这一服务模式能够有效降低更新与维护的成本水平

但随着高速智驾技术在实际中的应用推广, 城市区域内的智能驾驶技术逐渐成为关注焦点。数据采集效率与成本压力日益显现, 导致高速场景依赖离线高精地图实现高阶智驾的技术路线难以实现。首先, 城市区域的道路总里程规模远超高速公路路段, 且 road information 的更新频率显著提高。(全国城区道路总里程1000多万公里[5])通过实时感知 road information 的‘重感知、轻地图’方案成为各家追求的技术路线

在汽车制造领域中有一种基于运营车辆采集的数据积累方式进行离线高精度地图更新与扩展的操作模式目前这一方法仍面临着一个重要局限性即它导致了建图能力和单机能力之间的脱节这种脱节现象严重削弱了汽车规模化制造能够摊平各项成本的优势.将建图与定位功能统一纳入单机能力范畴是未来机器人技术发展的重要趋势"重感知轻地图"的发展方向正是这一趋势所指明的方向.通过将建图能力纳入单机能力体系实现路径包括众包建图或者在特定场景下采用专有车端解决方案.采用众包模式进行地图更新能够在不增加过多成本的情况下实现高质量的地图数据同时也能充分释放主机厂自身形成的完整数据闭环优势.在感知技术无法覆盖所有城区场景尤其是复杂或异形道路拓扑结构等特殊场景下当传统运营采集方式的成本已高到难以承受的程度时众包建图便发挥了其核心作用.众包建图的基础支撑是完整的数据闭环机制而这一基础能力对于实现有效的众包式地图构建比单纯开发专门的建图算法更为关键.借助当前各厂商新款车型标配的高阶智驾硬件系统众包式建图已不再是一种空想式的构想而是切实可行的技术方案.这种模式使得每辆汽车都成为了数据生成的源头从这个角度而言对造车企业尤其是新兴势力品牌的企业而言成为实现高级智能驾驶功能的关键力量.尽管偶尔有一些机构会发表一些观点但对于这一领域的发展贡献主要体现在技术创新层面

蔚来NT2车型 高阶智驾硬件

不仅仅存在上述问题,在拓展海外市场时也会遇到诸多挑战。由于相关法律法规的限制,在多数国家仅能支持本地提供的高精度地图——例如非洲部分地区短期内不具备此类资源——这直接限制了车辆实现 autonomous driving 的能力。因此,在全球扩张初期便已明确放弃对离线 high-precision 地图的依赖策略。

实时Local Map的生成

以感知能力为核心,在线生成高精地图最核心的逻辑

在本系统中,针对LocalMap的设计采用了两种不同的技术路线。其中一种是基于传统的方式,在实时感知数据的基础上进行局部语义矢量建图,并结合道路拓扑推理进行处理。其技术架构仍沿用经典的SLAM建图思路。另一种方案则采取了端到端的学习方法直接生成局部地图。值得注意的是,在该领域方面,清华大学赵行团队已取得了一系列具有创新性的成果[8]。

视频发不了...

HDMAPNet 端到端生成的LocalMap [9]

而实时感知无法覆盖的复杂场景,则通过 crowdsourcing 方式构建离线的高精地图。在地图规模上,在采用 crowdsourcing 方式时相较于全面构建全国城区其里程数大幅减少。这些特定区域复杂场景的地图则成为辅助弥补智驾系统感知局限的重要工具,并进一步成为感知系统的离线训练数据来源。它们不仅能够帮助提升模型的基本性能,在数据驱动下的闭环迭代过程中发挥了关键作用。

就目前而言,这是笔者对"重感知、轻地图"方案的独特理解与诠释。市场上已出现多种"记忆行车"类产品功能可供参考对比。例如大疆车载的"记忆行车"、理想汽车的"城市通勤NOA"以及小鹏品牌的"AI代驾"功能等。以关注度较高理想的"通勤NOA"为例,在具体实现上它采用了深度学习特征作为先验替代传统的地图元素[10]这一创新思路;然而其本质仍是一种基于离线高精地图的传统定位技术;这种定位技术虽然具备一定的规范性和可解释性优势;但也未能从根本上规避传统离线高精地图应用中存在的一些局限性问题;因此其价值与可行性也受到一定质疑;这种解决方案在当前技术条件下或许仅能作为一种辅助性的工具存在;难以长久持续下去

想汽车的NMP先验地图[10]

四 SLAM有长期需求的业务

基于上述分析可知,在重感知轻地图的技术发展趋势下

智驾中对经典SLAM方法存在长久需求的业务

需求场景1: 多传感器的离线和在线标定

多传感器内参数外参数标定是机器人学与智能硬件系统持续关注的重要问题,在自动驾驶技术中亦然。其核心包含两个环节:先是基于设备出厂状态下的离线标定方法研究;其次是基于实时数据积累后的在线自适应算法设计。值得注意的是这一过程可被视为建图定位问题的一种镜像形式:两者均采用相似形式的观测模型方程来描述同一几何关系;仅在于状态量定义存在镜像对称性——前者以位姿状态量为基础构建地图与定位框架;后者则以内参数作为未知数来求解系统参数。

离线标定的过程借助高精度辅助设备能够获得精度较高的出厂参数数据然而在车辆出厂后因碰撞等因素导致结构形变以及传感器老化等问题会导致原有的内外参数无法适用因此需要建立在线标定系统来实时或半实时地估计车辆内外参

离线标定[11]

在线标定与离线标定的主要区别在于没有依赖于高精度位姿真值参考系统这一前提条件,在实际应用中则是基于车端定位与感知系统的运行结果进行建模与计算,在满足观测约束条件下完成参数的有效估计

在众多经典的SLAM论文中,实时标定方法采用了将内外参数整合为状态向量的一部分的方式,并与位姿等其他参数协同优化。然而,在实际工程应用中,并非一种完美的解决方案。具体原因包括以下几个方面:

首先,在外参和内参的估算过程中往往需要依靠较强的观测约束条件和运动激励来获取足够的信息量。然而这与定位等实时状态估算系统追求低延迟的需求存在矛盾,并且由于车辆通常在二维平面内进行匀速运动这一特点,在某些系统状态下会出现欠激励的不可观测现象。这使得外参与内参的在线估算难以收敛。

内外参参数的变化率较低,在实际应用中通常采用月度或周度级别的更新周期即可满足精度要求。通过这种机制,在几十毫秒的时间间隔内就能完成状态估计并定期更新参数表层数据层的状态信息表层数据层的状态信息

内外参的估计属于非实时性任务,在车辆处于空闲状态时启动这些估算不会影响系统的实时性。为此可以在车辆停泊等空闲时段自动执行内外参校准工作从而实现资源的有效复用。具体而言第一种方案要求定位系统持续投入0.3个计算核用于处理在线标定任务而第二种方案则在车辆闲置状态下将全部计算资源 dedicated to online calibration achieving better precision results in practice

以上,在线标定更为合理的方式是构建一个独立模块,并将其设计为非实时或半实时类型,在车辆空闲期间持续不断地收集运动激励良好情况下的定位与感知系统数据片段,并在适当时机执行计算资源密集型联合优化处理以确保内外参数估计达到较高精度水平

在线标定[11]

需求场景2: 低速无GNSS场景的定位建图

不依赖于GNSS的低速行驶场景主要特指地下停车场这一特定环境。与高速行驶场景及城市区域环境相比,在这种环境下存在独特之处。回顾之前提到的无图方案时发现其并未放弃基于米级全视图和SD地图实现全局路径规划的努力。在实际应用中发现,在缺乏GPS支持的情况下构建这类区域的道路网络面临挑战。目前主流的技术路线是采用基于SLAM技术的地图生成策略

这篇视频介绍了华为推出的基于阿维塔平台的自动泊车服务功能AVP。该功能通过一次性建立单车与车位之间的连接关系,在地面车库入口至车主停车位位置信息的数据模型下运行。当该矢量地图生成完毕后,则实现了让车辆自动前往指定停车位或途经的所有车位的功能。在用户体验方面已经接近能够有效吸引用户购买的状态。这无疑是一个值得期待的重要进展,在这一领域展现了巨大的潜力,并且同样适用于SLAM技术的发展前景

在分析低速无GPS/格网导航系统(GNSS)环境下的定位建模技术体系时,我整理出了一套完整的解决方案架构。该体系主要由车载端和云端端两大模块构成,在具体实施层面则会遇到两个关键的技术抉择问题:首先是空间信息构建的具体路径选择——选择单一车辆本地化建图模式或基于多车数据的云端协作融合模式;其次是位置估计方法的选择——采用矢量地图辅助精准定位与基于几何特征提取的传统特征地图定位方法之间存在显著差异。

低速无GNSS场景建图定位技术栈

关于地图形式方面,在单次车端建图中采用的方式类似于华为及某些泊车类产品的做法。其特点在于直观呈现停车场环境信息的能力较强,在线生成停车场局部区域的地图较为便捷。然而此方法存在不足之处即未能充分利用车辆间共享的地图数据资源,在停车需求较高的固定车位场景中表现尚可满足使用需求但在停车资源分散的情况下则会面临较大的局限性

在定位方案上,目前矢量地图定位方案已成为定位方案中较为普遍采用的方式。其优势在于地图占用资源相对较低,在满足精度需求的前提下能够显著降低计算资源消耗。然而该方法也存在一些弊端:其一是在实际应用中对感知依赖较强且新旧停车场内部环境差异较大;其二则是感知模型存在泛化性问题导致部分停车场位置信息出现偏差甚至退化现象较为严重。另外一种方案则是采用SLAM中的几何特征地图并将之划分为视觉几何特征图和平面几何特征图两类主要特点在于通过去除对感知模型依赖降低了泛化性问题的影响;但这种观点也存在一定的局限性:即基于这两种不同模型的地图在占用资源方面会体现出较大的差异度其中以基于平面几何特征求解的算力与存储需求明显高于基于矢量空间模型的方法。此外无论是哪类方法都面临着通用性方面的挑战:视觉特征求解算法容易受到相机镜头参数变化影响造成匹配效果下降的问题;而基于激光雷达的方法则面临车辆配置受限以及无法直接兼容无激光雷达设备等现实障碍。因此选择哪类算法将取决于具体应用场景的需求偏好以及技术实现的可能性评估结果

地下停车场尤其是大型停车场以及多层停车场在SLAM建图与定位方面面临着较大的挑战。由于缺乏GPS信号,在这种环境下建图过程更多依赖于相对里程计和回环匹配效果。由于缺乏GPS的全局约束条件,在这种情况下构建的道路轨迹容易出现局部扭曲变形的问题。当相对里程计存在测量漂移现象时,则需要更高的初始值精度及较大视角偏差范围内的回环检测能力才能维持较好的定位效果。此外,在多层停车场中各楼层的高度一致性同样面临较大的技术难题。地库内部由于视线被部分障碍物遮挡的情况比室外更为严酷,在无法完全遍历所有内部道路路径的情况下会导致地图信息出现局部缺失的问题

地下水库局部地图的缺失与质量退化问题涉及系统设计阶段的难点,并对地库定位工作提出了更高要求。由于地下水库内部不具备 GNSS 信号,在现有产品中多数采用 outdoor 环境中的初始化定位方式;而在车载计算资源受限的情况下如何在定位失败时仍能有效进行初始化以保障匹配效果,则是一个极具挑战性的技术难题。对于多层停车场设施而言高度稳定性成为影响因素的关键点其中高度 drift 直接导致地图匹配效果急剧下降以及楼层匹配错误等问题

此外也存在部分 图商 在努力提供地下停车场 地图 的可能性 但与 高速高精地图 不同 的是 室内停车场地图 在定位层面 尚未达成统一 各家采取了不同的定位策略 主要受各家汽车制造商传感器方案 的影响 目前尚未实现统一化 且基于众包模式 停车场场景中的位置信息采集与地图构建任务 在短期内仍将以 各家 自主研发 为主

百度手机地图提供的停车场车位地图

需求场景3: 4DGT 感知标注

4DGT是在2021年的Tesla AI Day首次提出的新型感知数据标注方法。与传统的直接在二维图片上进行标注不同,它利用基于SLAM技术的三维重建方法,构建出精确的三维感知模型,随后将生成的三维模型投影到二维图像中,从而实现了低成本且高效的注释过程。该技术可作为位感知领域的重要数据来源,可作为该技术在实际应用中的重要案例。针对于不同的应用场景,4DGT技术也在不断拓展其应用边界,具体细节可参考前段时间地平线隋伟大哥的一份详尽报告[14]。

4D GT Pipeline[13,14]

The Last Choice:打不过就加入

随着技术手段不断更新迭代

earning 3D的技术方向[15,16,17,18]

智驾之外: 通用机器人

值得期待的是,在2023年通用机器人行业也迎来了充满新兴机遇的一年

Tesla Optimus 机器人,使用和Tesla电动汽车一样的Occupancy Network[19]

五 典型公司

全部评论 (0)

还没有任何评论哟~