Advertisement

概述:自动驾驶中的环境感知

阅读量:

1 前言

本专栏主要聚焦于自动驾驶领域中的环境感知技术及其相关发展。该内容涵盖感知技术的发展历程及其当前的状态,并展望了未来的技术趋势。在实际应用中,这类任务通常会采用基于算法的设计方案,因此,在介绍相关内容时,默认将以算法为基础展开讨论,特别强调其中深度学习相关的技术和方法。此外,文章中还会对相关的技术细节进行深入探讨,并结合实际案例进行分析与演示

环境感知系统中包含了两个核心概念:自动驾驶技术和环境识别技术。首先介绍的是‘自动驾驶’这一技术的本质。下面是维基百科上对‘自动驾驶汽车’这一技术的定义。

自动无人驾驶汽车也被称为无司机操作汽车或由计算机控制的行驶车辆,在这种设计下驾驶员可以选择辅助驾驶或完全不用操作即可前进。作为一种高度自动化的交通工具,在没有驾驶员直接操作的情况下它依然能够感知其周围环境并进行导航。

在上述定义中存在几个关键术语。其中第一个关键点是关于汽车,在讨论自动驾驶技术时,默认场景通常是针对车辆而非飞机或火车这样的交通工具。另一个重要方面是车辆对周围环境的感知以及导航系统的具体应用方式——具体而言就是根据设定的目的地进行决策与行驶操作。最后一点则是关于系统操作模式的选择——这涉及到自动驾驶系统的分级划分这一核心概念,请稍后详细阐述这一部分

自动驾驶技术并非从无到有地发生质变的过程,而是一个渐进发展的迭代现象。就自动驾驶系统的等级划分而言,目前最通用的标准是由美国汽车工程师学会(SAE)所制定的。不同机构所制定的标准虽然存在细微差异但核心概念是高度一致的以下表格对L0至L5六个等级进行了系统阐述这些定义虽显晦涩但结合车辆的功能特性则易于理解例如现代汽车标配的安全ABS系统以及电子稳定ESP系统都属于L1级别除此之外定速巡航ACC自适应巡航ACC以及车道保持辅助LKA等功能也均归入L1范畴因为它们仅能在单一方向上(横向或纵向)控制车辆一旦ACC与LKA同时实现则车辆将升至L2级别对于L2及以下级别的系统而言驾驶员须时刻关注周边环境并做好接管准备这一关键点也是导致许多L2级别车辆发生交通事故的重要原因即驾驶员对系统的期望过高未能始终保持对周边环境的高度关注若配备某种高级辅助驾驶Pilot系统如交通拥堵辅助系统则可达到L3级别这意味着在特定场景下如高速公路或拥堵路段驾驶员无需持续监控路况可松手松脚甚至松开视线只需在系统提示时接管车辆此时驾驶员的角色已从操作者转变为乘客对于L4级别的系统目前仅存在于试验车上我们常说某辆车在某道路上实现了XX小时无人工接管的自动行驶这都属于L4级别其区别在于不再需要人工接管即可实现车辆完全自主行驶而到了L5级别则彻底取消了这种限定条件该级别的车辆最具特点是没有方向盘所有驾驶权完全交由自动驾驶系统掌控此时所有人都是乘客

在深入理解自动驾驶的概念之后

其中

其中

本专栏着重探讨环境感知系统及其关键组成部分。重点阐述摄像头、激光雷达与毫米波雷达这三大核心传感器的技术特性及其融合技术。每种传感器都有其独特的优势与局限性,在特定应用场景下展现出显著的效果与适用价值。其中,在感知系统中应用最广泛的当属摄像头设备:其显著的优势体现在能够捕捉丰富的纹理细节与色彩信息,在目标分类任务中表现尤为突出;但同时也存在一定的局限性:首先是对远距离物体的识别能力相对不足;其次对其图像采集质量高度依赖于光照条件的变化;最后在实际应用中容易受到外部天气状况的影响而出现性能波动。相比之下激光雷达则弥补了上述技术方案在测距精度方面的不足:能够实现高精度的距离测量并准确描绘物体形态特征;因此特别适合于中近距离目标检测及测距任务场景的应用:然而其高昂的成本以及大规模量产所面临的诸多技术挑战使得这种设备的实际应用仍然受到一定限制:此外在极端天气条件下其性能表现也可能会受到一定影响。最后毫米波雷达以其全天候监测能力成为另一种重要的辅助手段:它不仅能够在复杂天气条件下提供精准的速度与距离测量结果而且还能实现较长距离的目标定位效果;同时相比前两者其实验成本相对较低且具有较高的性价比优势;但在实际应用中由于受限于硬件分辨率限制其对静止物体的垂直分辨能力仍显不足因而更适合用于低成本感知方案的设计或者作为辅助手段与其他技术结合使用

环境感知系统中的多种传感器

2 技术概览

上一节中提到,在自动驾驶与机器人技术领域中所关注的核心技术架构包括环境感知系统。该系统由多类传感器及其协同工作构成硬件架构基础;而软件层面的关键模块则聚焦于感知算法的设计与实现。总体而言,在该领域中的感知算法承担两大核心功能:一是目标检测任务;二是语义分割任务。其中前者可提取场景中重要目标的关键信息特征(位置坐标、尺寸大小、运动速度等),呈现出一种稀疏化的表征形式;后者则通过细致入微的方式获取场景空间中每一位置点的语义信息(如区分可通行区域、障碍物等),呈现出一种密集化的表征特性。将两者有机融合即形成了所谓的全景分割模型;这也是近年来人工智能研究领域最为热门的概念之一。就目标对象而言(如汽车、行人等物体),该模型将输出完整的分割掩膜图并标明类别与实例ID编码;而对于非目标对象(如道路标线、建筑物等建筑结构)则仅输出其对应的分割掩膜图及其类别标签即可满足需求。因此整个系统的目标就是通过获取车辆周围三维空间范围内的全景分割结果来支撑自动驾驶与机器人应用的基础决策支持功能;而对于不同级别的自动驾驶应用系统来说,则需要根据具体应用场景的需求来定制相应的感知输出参数设置方案。

随着深度学习在计算机视觉领域的重大突破,“自动驾驶”技术近年来取得了显著的发展。这种技术的进步主要源于对图像分类及物体检测技术的研发。“自动驾驶”系统中,“其中最为基础的应用便是对单帧二维图像内的目标进行识别与定位。”该领域的核心技术包括Faster R-CNN、YOLO、CenterNet等。“然而,在实际应用场景中仅依靠单一视角的数据是无法满足复杂需求的。”因此,“为了提升系统的智能化水平,“这些基础算法”还需要进一步优化与创新。“其中最为关键的就是如何将时间序列数据与三维空间信息相结合。”通过这种方式,“可以实现更加全面的目标识别与场景理解。”同时,“语义分割”作为这一领域的核心技术之一,则涵盖了从单帧图像到视频流再到三维空间数据等多种形式的技术方法

为了获取比现有方法更为精确的三维数据,在自动驾驶感知系统中,激光雷达扮演着关键角色。特别适用于L3至L4级的应用场景。其数据表现为稀疏的点云结构,在这与密集的图像网格结构相比存在显著差异。因此需要对图像领域常用的算法进行相应优化以适应点云数据的特点。其中点云感知的任务也可以按照物体检测和语义分割来进行划分:前者输出的是三维物体边界框;而后者则输出的是点云中每个具体点所对应的语义类别。此外还可以考虑改进基于卷积神经网络(Convolutional Neural Network, CNN)的方法使其能够有效处理稀疏分布的特点例如PointNet或者Graph Neural Network等模型架构

毫米波雷达因其全天24小时运行、精确测速以及低成本的特点而广泛应用于自动驾驶感知系统中;然而这种技术主要限用于L2级别的自动驾驶系统应用,并在更高层次如L3至L4级别作为辅助传感器使用;毫米波雷达的数据结果通常表现为点云形式;然而其空间分辨率相对较低;与摄像头和激光雷达相比;如聚类分析和卡尔曼滤波等传统方法的表现与深度学习不相上下;而这些传统方法的计算量相对较低;值得注意的是近年来研究者开始从更基础层面出发尝试用深度学习替代经典的雷达信号处理方法;通过端到端的学习架构实现了接近激光雷达级别的感知效果

单一传感器的感知能力始终存在局限性,在暂且不考虑系统的成本因素的情况下,在感知系统中采用多传感器融合方案则更为理想。通常情况下,在视频监控系统中必须具备摄像头这一基本的传感器以获取必要的深度信息以及完整的360度视场范围。为了更精确地获取三维空间中的物体信息以及运动信息,则可以通过将摄像头与其他类型的辅助感知设备相结合的方式来实现目标。值得注意的是,在实际应用中由于各传感器所采用的坐标系不同、其采集的数据形式各异,并且采集频率也有所差异;因此在设计相应的融合算法时绝非易事。总体而言,在决策层或者数据层面进行信息整合是两种主要的选择方式:其中数据层面的信息整合从理论上讲是一种更为理想的方法;然而在实际操作中需要对各个子系统之间的空间关系与时间同步性进行更高的要求。

3 行业现状

掌握感知系统中的技术构成后,请问您打算如何深入探索这些传感器在当前量产或演示车辆中的具体应用呢?

粗略来说,自动驾驶公司主要可分为两大类:一类是以传统汽车制造商为主的量产型公司(包括国外的大众、宝马、通用、丰田等国内长城、吉利等以及国内新兴的华为等),这类企业在技术发展上主要以L2级别方案为主,在L3级别技术实现方面也在不断推进中;另一类则是专注于高级别自动驾驶技术的研发与应用的创新型企业(如Waymo、Mobileye、Pony.AI等),它们在L4级别自动驾驶技术的研发上投入较大资源,并已开始向Robotaxi、Robotruck及Robobus等场景延伸其技术成果

不同自动驾驶级别及应用场景决定了传感器配置方案各有差异。在L2级别中(如紧急制动功能与自适应巡航控制),可选配前置单目摄像头或前向毫米波雷达即可满足需求;而针对车道变道辅助功能,则需要增加对相邻车道的感知能力。通常的做法是于车头与车尾布设多个角雷达装置(约360度覆盖范围)。到了L3级别时,则需扩展车辆对周边环境的认知能力(具体包括激光雷达、侧视摄像头、后视摄像头以及毫米波雷达等设备),同时配合GPS定位系统、惯性测量单元(IMU)以及高精度地图辅助定位工作。而当达到L4级别时,则必须放弃对驾驶员干预的依赖(此时所需传感器不仅要有高精度性能还需具备高可靠性特征)。这就需要通过增加冗余传感器系统来保证正常运行——即配备备用感知设备以确保系统稳定运行

下面我们来看几个具体的案例。

最近特斯拉推出了一项纯视觉驱动的自动驾驶技术方案。尽管尽管自动驾驶领域中公众最常联想到的是特斯拉这一品牌。然而实际上这仍属于L2级别的自动驾驶技术(或高级L2级别),因为驾驶员仍需随时准备接管车辆操作。这项方案主要依赖于部署于车身多个 strategic positions的不同焦距与视野范围的摄像头组合。这些摄像头不仅覆盖了360度无死角视野,并且采用了冗余设计以确保可靠性。值得注意的是,在深度学习算法层面的应用上——基于深度学习的多摄像头融合算法——个人认为这是一项非常值得深入研究的技术方向,并计划对这一技术进行深入解析与探讨。

特斯拉的纯视觉传感器配置(L2级别)

2017年夏季奥迪推出了第四代A8车型,在其设计当中最突出的特点便是配备了Traffic Jam Pilot(TJP)系统这一创新配置。前面已经提到过这一技术背景,在前文中我们已经阐述了TJP系统作为L3级别的自动驾驶技术 already取得量产水平的重要性。然而由于这一功能目前并未在普通车辆上配备,在实际交付的车辆中该功能尚未启用。从官方的角度来看这是由于法规方面的制约但更根本的原因还是技术层面的问题即L3级别所面临的"接管矛盾"问题。具体而言就是在低速环境下structured road拥堵情况下驾驶员可以选择低头玩手机或者休息但一旦遇到突发状况就可能出现无法及时接管的情况影响行车安全尽管奥迪于2019年底放弃了L3级别的自动驾驶研发项目但这一探索过程仍然为后续开发L4级别以及各种高级L2级别的辅助驾驶系统提供了宝贵的经验教训。
此外根据官方数据统计奥迪A8全车搭载了包括12个超声波传感器4个全景摄像头1个前置摄像头4个中程雷达、1个远程雷达、1个红外摄像机等在内的多套先进传感器设备以确保其卓越的安全性能表现。

奥迪A8的传感器配置(L3级别)

从L2到L3再到L4,在传感器技术方面的主要升级是增添了激光雷达设备,并且其数量实现了稳步提升。例如,在Waymo提出的方案中,在前向布置了一台激光雷达的同时还配备了后向和车顶覆盖范围内的360度扫描设备。值得注意的是这些设备的数量已经大幅增长能够覆盖约300米的工作距离。就目前的技术发展态势而言实现L4级自动驾驶系统的核心能力仍然是通过不断优化和扩展各类感知设备从而最大限度地提升对周边环境的认知水平其中最为关键的技术手段便是激光雷达设备的应用。在这一级别下车辆可以在限定场景内完全实现自主行驶但仅仅达到99%的安全标准已经无法满足现实需求必须保证高达99.99999%的安全可靠性水平只有通过多维度感知系统的精准融合才能为这一高标准提供可靠保障这种精准度依赖于多种传感器协同工作的基础保障

Waymo的传感器配置(L4级别)

以上仅作为初步展示了L2/3/4级别中传感器配置的具体案例,并非全面列举。专栏将深入探讨不同公司在自动驾驶技术研发中的独特路径,并详细解析其对应的传感器布局和感知架构设计。

全部评论 (0)

还没有任何评论哟~