Advertisement

旷视研究院获 CVPR 2023 自动驾驶国际挑战赛 OpenLane Topology 赛道冠军

阅读量:

近日,CVPR 2023 自动驾驶国际挑战赛比赛结果揭晓。**旷视研究院在 OpenLane Topology 赛道中战胜超过三十支国内外队伍,并斩获冠军。

一种先进的技术已经广泛地进入了人们的生活方方面面;然而,在追求L5级完全自主驾驶方面,
传统的处理手段仍然无法达到预期效果。CVPR 2023高级自动驾驶国际比赛将这一领域划分为
分别涉及背景环境认知、目标物体识别以及未来运动规划三个关键环节,并设置四个独立的比赛
类别。比赛旨在通过深入分析参与者面临的具体挑战与任务需求来提高整体性能水平。

738cef3fad99e320e1b4e92691a1608c.png

图片来源:Challenge at CVPR 2023 Autonomous Driving Workshop | OpenDriveLab

OpenLane Topology赛道赛题介绍

旨在更好地推进自动驾驶场景的理解研究工作,在这一领域内现有的场景感知任务最初基于对'道路边缘'的分割与检测进行展开,并逐步演进至对'道路中间线条'特征的精确识别阶段。然而,在现有研究中发现,在同一区域内的两条'道路中间线条'以及与其相关联的交通标志之间的内在关联并未被有效建模。该比赛创新性地要求使用 lane centerlines 替代传统的 lane edge lines,并结合各区域间的拓扑关联关系进行分析评估以确定车辆运行路径。

此外,在本次比赛中所采用的数据集中首次实现了交通标识与其所属车道之间的精确标注,并赋予了每条车道实时动态的道路信息。这些标注能够有效引导车辆在当前车道上的自身行为具有合理的方向性。比赛中所采用的输入形式是环视摄像头捕捉到的道路图像,并要求参赛者完成两个关键任务:一是识别车道中线;二是感知并理解道路拓扑结构中的各类交通元素。主办方依据各参赛团队提交算法所获得的平均感知精度(基于mAP评估指标)来进行最终排名

旷视夺冠算法介绍

该系统通过多维度数据融合技术实现道路环境信息的有效提取与处理,在拓扑关系建模方面具有显著优势。为确保系统性能达到预期指标,在数据采集阶段引入了智能传感器网络进行实时监测,并通过先进的算法对获取到的道路要素特征进行精确提取与表征。在此基础上建立的道路环境数据模型能够有效支持后续的安全评估与决策分析工作。

相较于传统的 3D 车道线检测任务而言,在本研究中所关注的 3D 车道中心线在图像中往往没有明显的几何特征。因此在本研究中所关注的 3D 车道中心线检测需要依赖于周边 3D 车道线的空间布局信息。由于该检测过程涉及较大的视觉覆盖范围需求,在现有研究的基础上进行了系统性对比分析后选择了旷视自研的 PETRv2 框架[2]作为基准模型。基于对现有技术框架性能特点的全面评估与实验验证结果表明,在众多候选方案中旷视自研的 PETRv2 框架表现出最优的整体性能水平。
在该框架中 lane queries 利用全局注意力机制与图像特征进行交互作用实现了涵盖全局语义与局部细节双重表征的能力框架这种设计使得模型能够在捕捉整体结构特征的同时 充分利用局部细节信息来进行预测推理。

19c2107d23f6d9cecf151578e4484462.png

基于以往比赛的实践经验,在进行交通元素检测任务时,我们选择了YOLO系列中的最新版本模型YOLOv8[3]作为基准模型进行研究。相较于其他主流的二维目标检测方法,该算法在运行效率方面表现更为突出,并且能够实现更高的检测精度和准确性。

45900aab0885ce7f4c01aefc93a1b8d7.png

基于 YOLOv8 和 PETRv2 的基础上, 我们构建了一个多阶段网络架构, 并将其延伸至拓扑关系预测领域。首先, 利用预先训练好的 YOLOv8 模型, 通过与前向视角图像进行交互来完成交通要素识别任务, 并提取相应的交通要素特征。随后, PETRv2 模型基于多视角图像特征信息生成三维车道中心线检测结果及其对应的车道中心线特徵。这种设计旨在尽可能保证二维检测性能的同时实现交通要素特徵与车道中心线特徵的有效对齐。最后, 基于两个任务所提取的特徵信息, 将相关特徵进行融合处理, 分别采用了两组多层感知机模型来预测相应的拓扑关系矩阵

57c84bd2fc43af03db72af34d3b82665.png

最后,在OpenLane Topology Challenge中,我们的集体MFV模型凭借其卓越性能,在ols指标方面展现突出表现并列第一。

923e5de7cacc98f1ab0023f8e7f80533.png

https://opendrivelab.com/AD23Challenge.html#Track1

Wang et al. (2023)提出了RoadGenome这一基于拓扑推理的基准数据集,并用于场景理解与自动驾驶领域中的研究工作

[2] Liu, Yingfei, et al. "该研究提出了一种综合性的框架来处理多摄像头图像的三维感知问题。" arXiv预印本arXiv:2206.01256(2022)。

[3] https://github.com/ultralytics/ultralytics.

2066a1e5f9f29fc90d567877a4fe7dcf.gif

全部评论 (0)

还没有任何评论哟~