高德地图自动生成轨迹_自动驾驶中高精地图的大规模生产:视觉惯导技术在高德的应用...
稿件来源:阿里云开发者社区
本文首先将介绍视觉传感器与惯性导航系统的主流设备及其融合框架;接着阐述视觉-惯性导航融合系统的相关关键技术;然后详细讨论高德公司基于视觉技术开发的道路标志与地面标识要素自动识别与标注系统;最后深入分析了该技术在高精地图精度提升过程中面临的主要挑战及其未来发展方向。
视觉惯导技术具有广泛前景
高精度地图是实现无人驾驶的关键技术基础之一。
精确的地图对于无人驾驶汽车的定位、导航控制及安全性具有至关重要的作用。
伴随着无人驾驶技术的持续发展。
随着相关领域的快速发展。
在开发过程中需兼顾规模与实时性问题。
能够向不同车型提供海量数据支持,并在这一领域占据领先地位。
现已成为全球范围内覆盖范围达到32万公里以上的高等级道路高精度地图数据推出的平台。高德采用的是结合激光雷达采集和图像视觉惯性导航技术两种方式进行数据获取与融合处理。
采用图像视觉惯性结合的技术手段进行数据采集,在一定程度上能够显著降低硬件成本。此外,在对高精度地图进行识别时具备一定的优势,在提高车道级别要素作业效率方面表现出明显效果。因此这一技术方案在大规模高精地图生产中的应用前景广阔。

高精地图主要由高精度的地图要素矢量信息构成。在获取这些高精度的地图要素数据时,则是采用了两种不同的方法:一种是利用视觉图像识别技术来提取地图要素目标;另一种则是依靠惯性导航系统提供的关于车辆位置和姿态的数据。经过这两方面的融合与计算后,则形成了相应的矢量地图要素描述。
视觉惯导硬件工具篇
视觉设备
主流视觉设备基于其工作模式的不同可分为单眼相机(Monocular)、双眼相机(Stereo)以及深度成像相机(RGB-D)等主要类别。
单目相机架构较为简单且价格较为亲民,在成像效果上仅能反映场景物体的二维投影特性。这种相机系统无法获取场景中各物体间的相对深度信息,并且无法直接通过单一图像计算出场景中物体与观察者之间的距离。只有当物体发生运动时才能基于其几何变形特性推导出相应的深度信息。
双眼摄像头包含两个单眼摄像头,在此固定间距下进行工作。我们利用这个已知的距离来确定每个像素的空间位置。这种安排使得双眼摄像头能够测量物体的深度范围与其间距长度密切相关:当基线长度增加时,则能测距精度也随之提升。
由于无人车的应用需求较高, 其搭载的双目相机配置较为复杂. 一个显著缺点是, 其配置与标定过程均较为复杂. 深度量程和精度受限于双目相机基线和分辨率等因素. 此外, 视差计算过程对计算资源的要求非常高.
深度相机的工作原理是利用红外结构光技术,并借鉴激光传感器的工作模式,在发射激光信号的同时接收反射回来的光线信号,并据此推算出物体相对于相机的空间位置信息。相比之下,在计算方面它与双目摄像头不同:双目摄像头通常依靠软件算法进行数据融合计算以获得三维信息;而深度相机则直接基于物理测量的结果进行定位。因此相比双目摄像头而言,在计算效率上有着显著的优势。
深度相机存在诸多方面的局限性,在实际应用中主要表现为以下几点:首先其覆盖区域有限;其次信号质量较差;再者观察视角受限;此外还容易受到外界光线的影响;不适用于穿透性材料的检测;此外还有其他一些限制因素。这些特点使得其在户外环境中使用效果并不理想
基于高精地图需要大规模生产的迫切需求,在实际应用中较为常见的高质量的地图数据感知设备多采用单目摄像头。这种摄像头凭借其低成本和易于安装的特点,在保证制图精度的同时实现了视觉定位功能,并因此成为当前广泛采用的高质量地图感知设备。
惯导设备
惯性制导系统是一种完全自主的导航技术,在不依赖任何外部传感器数据的情况下运行,并且不会向外发射或接收能量。其适用工作环境广泛,涵盖空中(如飞机和无人机)、地面(如汽车和机器人)以及水下(如潜艇和水下机器人)等多个领域。
惯性导航系统的运行原理主要依据牛顿运动学定律,在实际应用中需要基于对载具在惯性参考系中的加速度值进行测量,并将其累积到时间维度上。随后通过数学运算将这些数据转换至导航坐标系系统中。这种处理方式能够有效计算出导航坐标系下的速度矢量、方位角以及位置数据等关键参数信息,在军事装备、测绘技术以及资源勘探等多个领域得到了广泛应用
惯导系统展现出卓越的抗干扰能力,并且具备较强的自主性及较高的数据传输频率;其稳定性亦十分优异。根据漂移率从低到高的顺序划分后段为导航级至消费级的不同级别。目前,在自动驾驶及高精度地图制作领域中主要采用战术级别的惯导设备来满足高精度定位的需求。
此外,在这一技术的发展过程中形成了挠性型式、光纤型式以及激光型式等多种形式的导航控制系统,并在此基础上衍生出了微型电机械系统型式的导航技术。其中微型电机械系统(Micro-electromechanical Systems, MEMS)具备体积小巧便携性优 lightweight特性以及能耗低经济实惠抗摔性能,并得到了广泛应用。该技术不仅得到了广泛应用,在这一技术的发展过程中形成了挠性型式、光纤型式以及其他多种形式的导航控制系统,并在此基础上衍生出了微型电机械系统型式的导航技术。其中微型电机械系统(Micro-electromechanical Systems, MEMS)具备体积小巧便携性优 lightweight特性以及能耗低经济实惠抗摔性能,并得到了广泛应用并延伸至中低精度级别的战术级应用领域
当惯导系统独立运用时会产生累积误差,在实际应用中通常会与其如GPS、北斗等代表性的全球导航卫星定位系统(Global Navigation Satellite System, GNSS)等辅助手段相结合形成完整的组合导航系统,并以此准确地确定载体现状的空间信息
当导航信号中断时,利用惯性导航系统的积分计算可以获得较高的实时位置与姿态估算值。对于对定位精度要求较高的非实时需求的测绘任务,则可以通过数据平滑处理方法提升测量结果的质量。
在移动测绘领域中,惯导系统的主要功能之一是与激光测距仪等外部传感器协同工作。借助与全球导航卫星系统(GNSS)系统的合作获取的载体姿态信息,在提升图片姿态定位的同时实现了高精度高频次定位;经过多维度传感器间的标定处理后将获取的信息准确地投射至统一的空间三维坐标系中。
惯导的一种替代方案是通过与视觉传感器协同工作形成视觉惯性里程计(Visual Inertial Odometry, VIO)。然而,在动态物体占据图像主体或场景特征贫瘠的情况下...
整合惯导数据有助于提升整体定位精度和连续性。MEMS惯导单元普遍嵌入智能手机设计中,在这一技术基础上开发出了多种VIO实现方案。其中广泛支持增强现实应用的VIO实现方案主要由苹果公司推出的ARkit框架和谷歌公司推出的ARcore框架提供。这些解决方案均以支持增强现实应用需求为目标。
多传感器融合的定位导航方案已经成为了当前技术发展中的趋势。其中一种关键方法是惯性导航系统(INS)与GPS/GLONASS等卫星导航技术相结合的方式,并进一步整合了图像传感器、激光雷达等多种辅助设备以提高系统的整体性能和应用范围
视觉惯导框架及关键技术
目前主流的视觉导航与跟踪融合框架主要包含两个组成部分:前端感知系统与后端优化模块。其中 frontend 部分负责从传感器中提取观测数据并构建动态模型以实现状态估计;随后 backend 部分通过收集 frontend 提供的数据进行优化处理;最终输出相机的位置信息、姿态估计结果以及全局地图数据(如图所示)。

在视觉惯导技术框架中实现前端与后端的优化是关键技术,在本文中主要介绍了一种基于滑动窗口模式的视觉融合惯导局部相对优化方法;当初始定位出现偏差时,则采用纯视觉SFM与惯导对齐相结合的方式重新定位;通过相对误差校正达到了整体精度的最大提升;最终实现了地图坐标的全局精确确定
高德高精地图生产技术方案
高精地图的生产主要由两类要素构成:一类是标线设施(如路面指示标线、红绿灯等),另一类是地面标线与方向符号(如车道分隔线、方向箭头等)。这两类地图要素都需要先确定位置坐标,并通过建立与路网的连接关系(即关联),从而获取其属性参数以及相应的几何数据。
地图要素的生产实现了人工作业与自动化提取的结合。首先利用外业采集的数据进行图像与轨迹解算得到了实现 automation 所需的关键视觉信息接着应用 visual fusion 技术生成 map elements 并在已有的自动化的基础之上采用人工干预的方式完成 web 编辑模型最后将生成的地图数据存储到相应的数据库中

感知结果示例:

生成地图示例:

未来趋势
基于惯导视觉的高精地图生产方案种类繁多。国内外多家企业如Moment、宽凳科技以及lvl5等均致力于相关技术的研究。然而,在当前市场中受限于设备成本因素... 基于视觉技术获得的高精地图其精度通常维持在10厘米以下。
后续阶段中,在以视觉为基础的地图高质量发展过程中,则可能朝着多源数据整合的方向演进——即对同一条道路进行多次采样收集,并利用不同类型的传感器或设备获取的数据源进行整合处理。这种做法一方面能够显著提升地图的整体精度;另一方面则能够缩短更新周期。
高德深耕地图行业,在这一领域已布局充足的地理空间数据资源,并借助领先的技术积累和成熟的制造工艺体系为自动驾驶相关技术研究奠定基础保障;通过持续的技术创新积累与应用实践探索,在实现智能驾驶功能开发方面已取得显著进展;这些技术创新成果将为推动自动驾驶产业发展提供持续动力支撑
高德深耕地图行业
