自动驾驶SoC:自动驾驶竞赛的制高点
汽车半导体的概念,什么是汽车芯片
汽车半导体领域涵盖广泛,在多个领域发挥着重要作用。在其功能上分为汽车芯片、功率器件以及传感器等。
其中芯片又被称为集成电路,在现代电子设备中具有很高的集成度。通常所说的汽车芯片特指车载计算设备中的专用集成电路,在按照集成规模划分时主要可分为MCU芯片与SoC芯片两大类。相比之下功率器件由于其较低的集成度而被归类为分立器件,在实际应用中主要包含用于电动车逆变器和变换器中的IGBT、MOSFET等关键元件。传感器方面则主要包含智能车上的雷达与摄像头等精密测量设备。

汽车SoC芯片 Mobileye(英特尔)、英伟达、高通、华为、地平线、黑芝麻等
汽车电子控制单元(MCU)芯片包括恩智浦(NXP Semiconductors)、英飞凌(Freescale Semiconductor)、瑞萨电子(Renesas Electronics)、意法半导体(STMicroelectronics)、德州仪器(Texas Instruments)、博世集团(Bosch)、安森美工业技术部(Ansell Electro-Mechanical)以及微芯科技(Microsemi Corporation)。
汽车功率器件 英飞凌、安森美、意法半导体、CREE、比亚迪、中车时代电气等
汽车芯片,正从MCU芯片,进化至SoC芯片
MCU被定义为芯片级的芯片,并也被广泛称为单片机;其通常仅具备一个处理器模块;具体来说,MCU的组成包括中央处理器(CPU)、存储器以及接口模块;另一方面, SoC被视为系统级的集成电路,通常集成有多个功能模块;例如SoC可能整合了从中央处理器(CPU)到图形处理单元(GPU)、数字信号处理(DSP)、神经处理单元(NPU)等多个功能模块以及相应的存储和接口资源。
在当前全球汽车消费能力提升的大背景下

随着汽车产业向智能化方向持续深化发展,
其主要推动力来源于两个关键领域:
一是不断成熟的智能座舱技术,
二是迅速发展的自动驾驶技术。
这一系列进展使得传统架构与算法的需求面临显著提升的压力,
促使相关企业加快向采用更强算力SoC芯片转型。
伴随着汽车电子化的迅速推进,在疫情期间,对车载控制系统的需求持续攀升。由此可见,在这种情形下,车载MCU芯片仍然面临供不应求的局面,并且问题显得尤为紧迫。

在全球汽车MCU芯片领域中,目前呈现群雄并立的竞争态势。这种深度绑定关系导致了定制化需求和外包生产的持续增长,在供应链扩展过程中带来了显著挑战。例如,在战略联盟方面,瑞萨已实现丰田的技术整合;英飞凌则已开始深化德系合作伙伴的关系

目前处于成熟制程的MCU芯片短缺,由多种原因造成:
①新冠疫情+日本地震+德州暴风雪+中国台湾缺水。
全球约70%的汽车MCU生产集中于台积电,在该年的相关代工收入仅占其整体业务的3%。在当前成熟制程段中运行(其中高端自动驾驶SoC芯片则需采用更先进的7nm工艺),由于单体利润相对较低且缺乏扩产动力,在此阶段必然会导致MCU产能呈现紧张状态。
③上游设备商亦由于利润较低而减少了对成熟制成的生产设备的生产,在生产线方面也面临难以补充的情况。④疫情期间消费电子产品销售出现大幅增长带来了明显的产能紧张局面。

汽车智能化,智能座舱带动SoC芯片先行
汽车中要用到SoC芯片的主要为智能座舱和自动驾驶两个方面。
与自动驾驶处理器相比,在构建难度上智能座舱处理器较为容易实现。即使完全失灵,在保障车内人员安全方面依然具有重要意义,并且其技术规范(over-ceil)相对简单。在智能汽车处理器的技术较量中,“前哨战”的位置由智能座舱处理器占据,“主战场上的重要地位”则由自动驾驶处理器所占据
由未来智能座舱整合的"车载信息娱乐系统+流媒体后视镜+抬头显示系统+全液晶仪表+车联网系统+车内乘员监控系统"等多种融合体验,全部都依赖于智能座舱SoC芯片
在智能座舱芯片市场上的主要竞争者包括消费电子领域的高通、英特尔和联发科等公司,在这一领域均专注于高端应用领域;此外还包括NXP 作为德士古 Texas Instruments以及瑞萨电子等传统汽车芯片厂商,在这一细分领域内其产品主要用于中低端市场

目前国内市场主要采用座舱域控制器芯片的产品主要来自德士古公司 Jacinto6 和 NXP 的 i.mx6 等前代产品。国内新加入市场的竞争者主要包括华为(与比亚迪合作开发麒麟芯片上车)以及地平线(长安UNI-T与理想ONE均采用基于征程2架构)
自动驾驶,推动“架构变革+算力提升” ,带来SoC芯片爆发增长
在传统汽车的E/E架构中,ECU负责单一功能的控制。单个 MCU 芯片即可实现这一需求。然而,在汽车产业智能化发展的推动下,车载传感器数量持续攀升。这种传统的分布式架构面临瓶颈问题:由于 ECU 分布式架构无法有效应对车载传感器数量激增所带来的系统复杂性提升与通信延迟问题,在实际应用中往往难以满足系统性能需求
1)ECU算法只能处理指定传感器的数据,算力不能共享;
分布式架构增添传感器和ECU的同时,在车体内部署大量通信总线会带来装配难度增加及整车质量上升的问题
车内ECU由多个供应商提供,在统一化编程方面存在障碍,并未能满足整车OTA升级需求
基于汽车域集约化架构的域控制器(DCU)及基于中央集约化架构的中央处理器均需配备SoC芯片。随着智能网联汽车时代的兴起,特斯拉作为引领者率先采用中央集约化架构策略,并成功实现了整个车辆系统通过单一处理器实现全车态管理的功能。这一做法不仅简化了系统结构,还显著提升了车辆运行效率。目前全球各大主要车企纷纷认识到车控集约化的趋势,并在此基础上制定了相应的技术标准与实施计划。值得注意的是,在此过程中,域控制器承担了整合前期ECU所具备的运算处理能力的任务,并因此对计算资源的需求较单一ECU有所提升。

自动驾驶SoC:自动驾驶竞赛的制高点
处理器芯片作为基于MCU/SOC架构的核心组件,在现代电子系统设计中占据重要地位:具体而言,在这种架构下主要包括中央处理器(CPU)、图形处理器(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)以及场可编程门阵列(FPGA)等多种类型。在典型的MCU芯片设计中仅具备中央处理器这一项功能,在SoC架构则会包含除CPU之外的多种其他处理器模块以满足复杂的系统需求
CPU、GPU、DSP都属于通用处理器芯片:
①CPU是中央处理器,擅长处理逻辑控制。对CPU进行优化调整,发展出
②善于处理图像信号的GPU和
③善于处理数字信号的DSP。
ASIC属于专用型 processor 芯片.FPGA 被归类为 half-generic processor 架构.These dedicated AI algorithm accelerators, such as EyeQ (Mobileye), BPU (Horizon), and NPU (including those from寒武纪 等), are all classified under the generic ASIC category.FPGA is defined as a programmable logic array and is categorized as a half-generic processor architecture.This architecture imparts the capability for hardware-level functional customization.

自动驾驶SoC芯片:“CPU+XPU”架构,XPU有多种选择
自动驾驶芯片是一种能够达成高级别自动驾驶任务的SoC架构,在设计中通常采用CPU与XPU相结合的多核架构设计,在L3+级别的应用中需具备500+TOPS的运算能力;仅依赖于CPU处理器无法满足高性能需求;在自动驾驶SoC芯片的设计中,通常会集成一个或多个专用处理单元(如GPU/FPGA/ASIC)来执行AI运算任务;用于AI运算的应用加速处理单元可以选择GPU、FPGA或ASIC等多种类型以提高计算效率
在自动驾驶AI运算领域中,CPU、FPGA和ASIC各有专长:作为SoC芯片的核心管理单元,在调度能力和协调性能上相对突出;而针对AI计算需求,则相应的解决方案多采用GPU、FPGA或ASIC架构,并根据具体应用场景进行优化设计
GPU在数据密集型应用中进行计算和处理时表现出色,并且特别适用于CNN/DNN等不依赖于顺序的图形类机器学习算法。
FPGA在序列型机器学习算法如RNN/LSTM和强化学习中展现出显著的优势
ASIC是一种针对特定算法需求进行专门化设计的专用芯片,在定制化设计的基础上展现出体积大幅缩减、重量显著减轻、功耗消耗大幅降低、性能明显提升以及保密能力得到显著加强的同时整体成本大幅下降。

现有市场上主要的技术路线有三种:自动驾驶SoC芯片处理器架构方案(亦称技术路线),它们分别代表了不同的设计理念与创新方向。
以英伟达和特斯拉为代表的一些科技公司,在其出售的自动驾驶SoC芯片中采用了CPU、GPU和ASIC的组合方案
Mobileye、Horizon等新兴科技公司专注于研发与销售自动驾驶专用AI芯片,并基于CPU+ASIC的技术架构进行设计
包括以Waymo、百度为代表的科技巨头在自动驾驶算法研发中基于CPU+FPGA(+GPU)架构展开探索。
方案①:英伟达和特斯拉的 “CPU+GPU+ASIC”方案
英伟达Xavier架构基于GPU为核心计算单元:其主要组成部分包括四个关键部分: CPU、GPU、Deep Learning Accelerator(DLA)以及Programmable Vision Accelerator(PVA)。其中占主导区域的是 GPU芯片组;紧随其后的是CPU;为了进一步提升性能并行配置了两个ASIC芯片组:一个是专门用于推理功能的DLA;另一个则专门用于加速传统计算机视觉任务的PVA。

特斯拉FSD采用NPU(一种ASIC)作为其计算核心:该系统由三个关键组件构成——CPU、GPU和Neural Processing Unit(NPU)。在这些组件中,面积最大且最重要的部分是特斯拉自主研发的NPU(属于asic),它主要用于执行深度神经网络的任务。而GPU则主要用于执行深度神经网络的后处理过程


方案②:Mobieye EyeQ5的“CPU+ASIC”架构
EyeQ5 包含四个关键组件:中央处理器(CPU)、视觉处理器(CVP)、深度学习加速器(DLA)以及多线程加速器(MA)。其中 CVP 是专为多种传统计算机视觉算法优化而设计的专用集成电路。自成立以来,Mobileye 就以其独特的CV算法闻名.同时通过采用独特的专用集成电路来处理这些算法从而实现了低功耗性能.

地平线自主研发了AI专用ASIC芯片:Brain Processing Unit(BPU),可提供软硬件结合的人工智能解决方案。基于BPU架构的征程2芯片能够支持达到4TOPS水平的人工智能计算能力,并且能够高效灵活地完成多种AI相关任务处理工作;同时具备快速准确地完成多种目标检测与识别的能力。征程2 chips充分展现了BPU架构的强大灵活性,并全面提升了其在汽车智能化领域的应用潜力。

Waymo的计算平台架构集成英特尔Xeon处理器集群,并与Altera公司的Arria系列FPGA进行高效配合;该系统通过英飞凌Aurix系列微控制器实现CAN/FlexRay网络的可靠通信接口连接
其中Arria系列FPGA在完成自动驾驶算法的固化过程后可能被专用ASIC进行功能模块的整合与优化

“CPU+ASIC”方案将成为未来商业化主流
在自动驾驶技术尚未完全成熟固定化的过程中,CPU+GPU+ASIC的架构仍将持续占据主导地位.一旦自动驾驶算法达到完全成熟,定制化的批量生产模式下,低功耗、低成本的专用自动驾驶AI芯片(ASIC)将会逐步取代现有高功耗的GPU,而CPU+ASIC架构也将随之成为新的主流.
虽然最初是为支持大型电脑游戏进行图像处理而开发的 GPU 却展现了强大的计算能力并广泛应用于机器学习和神经网络训练领域然而 在能效方面存在一些不足 尤其是在计算能耗比这一指标上 ASIC 的表现最佳 接下来依次是 FPGA GPU 和 CPU 在功能定位上 ASIC 做了针对性优化 这使得它不仅体积更小 功耗更低 更可靠而且性能更为突出 但其主要缺陷在于较高的研发成本和较长的研发周期
FPGA主要用于算法验证测试,并未在大规模量产中占据优势地位。基于FPGA的人工智能处理器虽然展现出高性能与低能耗特征,并且支持硬件编程功能,但其在大规模工业化应用方面仍存在较高生产成本的问题。因此,在自动驾驶算法软件领域中占据主导地位的企业如百度与Waymo等均倾向于采用CPU与FPGA相结合的技术方案以实现更低的成本投入与更高的效率提升。
参考文献:
中金公司分析报告
