KAIYUN体育「中国」网页·登录入口-全网最全赛事官方网站

【招银研究行业深度】AI应用之智能驾驶——AI赋能助飞跃高阶智驾迎奇点-Kaiyun体育中国登录入口

【招银研究行业深度】AI应用之智能驾驶——AI赋能助飞跃高阶智驾迎奇点

  目前,中国在汽车电动化发展中获得领先,而被公认为汽车革命下半场的智能化成为全球各大车企竞争的焦点。近两年,以Transformer为代表的大模型较CNN在数据训练的优势更为突出,在自然语言处理领域几乎取代了RNN,并被引入计算机视觉领域,成为高阶智驾发展的核心引擎。我们认为AI驱动的智能化正为中国汽车产业塑造新的竞争优势,或将促使我国汽车产业从市场追随者向行业规则制定者转变。

  ■ 驱动高阶智驾加速渗透的因素是什么?从政策端看,工信部联合其他三部门敲定了首批九家获得智能网联汽车准入及L3级别上路通行试点资格的企业名单,这标志着高阶智驾的商业化落地正渐行渐近。从需求端看,智能驾驶凭借显著降低人为因素引发事故、提升道路交通安全水平的优势,已成为影响用户购车决策的关键因素。从供给端看,特斯拉FSD的迅猛发展以及硬件成本的持续降低,正促使中国车企与科技企业加速高阶智驾领域的产业布局。

  ■ AI如何赋能高阶智驾持续升级?从算法端看,AI大模型的发展与智能驾驶技术的演进之间已形成深度共生关系,从技术底层、系统能力到生态体系均实现双向赋能。从算力端看,特斯拉车端算力芯片自研,国内车企则主要基于英伟达等第三方算力芯片;特斯拉和国内车企均布局云端算力中心,但特斯拉在云端算力规模上断层领先。从数据端看,量大质优的数据成为高阶智驾时代的“稀缺品”,数据闭环的效率是特斯拉与国内车企在自动驾驶领域最大的差距之一。

  ■ 高阶智驾如何影响汽车行业的竞争格局?从车企角度看,智能驾驶有望引发汽车行业新一轮淘汰赛,尤其是对中高端市场格局的影响更为显著,自主品牌车企可凭借软件算法自研继续提升市场份额,而智驾能力较弱的中高端合资品牌或将被淘汰出局。从供应商角度看,由于车企智驾自研能力存在分化,第三方智驾解决方案提供商仍有较大的生存空间。

  ■ 业务建议及风险提示。风险方面需要关注智驾技术变革、市场接受度、法规政策、行业竞争加剧的风险。(本部分有删减,招商银行各行部如需报告原文请登录“招银智库”查看)

  汽车产业从“电动化”迈入“软件定义”新阶段,产品属性向“移动智能终端”进化。而Transformer架构为高阶智能驾驶的商业落地注入革命性动力:感知层面,“BEV+Transformer”融合多模态感知构建厘米级精度动态语义空间;决策层面,千亿参数端到端模型(如FSD V12)缩短响应延迟80%,实现城市级场景自适应;数据维度,并行计算与AI标注协同降低数据成本40%-50%。技术迭代推动2024年城市NOA(Navigate on Autopilot,领航辅助驾驶)渗透率突破15%,端到端车型量产成本压至20万元级,并衍生车路协同等万亿市场。本篇报告将解构智驾技术演进路径,剖析车企竞争内核及行业格局变迁,同时研判商业银行在智驾生态中的价值锚点与风控挑战。

  整车核心技术历经从“马力”到“电力”再到“算力”的变革。燃油车时代,整车的核心技术壁垒是发动机、变速箱和底盘,由于机械结构复杂且外资车企经过近百年的积淀,自主品牌想通过燃油车实现超越难度极大,因此外资/合资车企占据主要的市场份额。电动车时代,整车的核心技术壁垒变为动力电池、驱动电机和电子控制,外资品牌构筑的技术优势被完全打破,自主品牌得以实现弯道超车。我们认为智能车时代的核心技术壁垒又一次发生重大变迁,电动车时代的“三电”仍是智能车的技术底座,但新能源汽车月度渗透率已经过半,三电技术趋于成熟,AI(Artificial Intelligence)赋能的智能驾驶和智能座舱将成为智能车时代的核心技术。

  智能化和电动化并非孤立,而是相互促进、共同演进的关系。市场普遍认为电动化是汽车行业发展的主线,但随着自动驾驶、智能座舱、车联网、AI大模型等技术的不断突破,智能化正成为电动化的接力棒。我们认为两者并非简单线性发展的关系,而是相互促进、共同演进的双螺旋结构。电动化为智能化提供了技术平台和物理基础,而智能化的发展又进一步推动电动化技术的广泛应用和快速迭代。中国正凭借其在科技领域的实力,对汽车产业的价值链和生态结构进行重塑,通过智能化的特色配置,不断增强其在全球汽车市场的竞争力。

  汽车智能化正在构筑中国汽车产业的全新竞争优势,促进我国从市场追随者向行业规则制定者转变。在经历以电动化为核心的上半场竞争后,我国新能源车产业已在市场表现、技术突破和产业链布局方面形成先发优势,为巩固全球领导地位,车企正加速向智能化赛道纵深拓展。通过将智能技术深度植入研发制造体系,行业不仅能够响应消费者对智慧出行的升级需求,更将推动全球汽车产业的革新方向。智能化既可能扩大新能源车企与传统燃油车的竞争优势差,也为重视智能研发的企业创造弯道超车机遇。从产业维度看,智能化转型将驱动中国车企实现核心技术突破、品牌价值跃升和市场版图扩张,助力我国在全球产业链中构建从关键零部件到终端产品的全链条主导力,最终实现从市场追随者向行业规则制定者的角色蜕变。

  智能驾驶是汽车智能化的关键分支,技术Kaiyun平台 开云体育官方入口始终是其发展的核心引擎。技术的每一次突破,都直接推动了安全性的显著提升,促使成本不断下降,而这两者又进一步决定了智能驾驶商业化落地的时间预期。回溯过往100年,全球智能驾驶发展历经四个阶段:

  实验室探索阶段(1925~1999年):全球第一辆“自动驾驶”汽车可以追溯至1925年,其操作方式与现代玩具车类似,主要通过无线电控制技术实现其“自动驾驶”。60年代初,人工智能(Artificial Intelligence,AI)技术的引入标志着车辆控制系统从机械控制向电子控制的重大转变;80年代末,美国卡内基梅隆大学开启了自动驾驶技术的实验,进一步推动了这一领域的研究和创新。

  商用化探索阶段(2000~2012年):2004年和2005年,美国国防高级研究计划局(Defense Advanced Research Projects Agency,DARPA)成功举办了两届无人驾驶挑战赛,这激发了众多商业机构对自动驾驶技术的投资和研发热情。2009年,科技巨头谷歌启动了其无人驾驶项目,标志着自动驾驶技术开始进入商用化探索阶段。

  商用化加速阶段(2013~2019年):2012年,被誉为“深度学习之父”的Geoffrey Hinton引入神经网络(Convolutional Neural Networks,CNN)算法,标志着深度学习进入蓬勃发展的新纪元。自动驾驶技术也由此受益,通过与神经网络算法的结合实现了快速发展。2013年开始,传统车企和新兴创业公司纷纷布局无人驾驶,加速了无人驾驶技术的商用化进程。2015年特斯拉推出Autopilot功能,将自动驾驶技术整合到消费级电动汽车中;2017年奥迪推出了具有高级辅助驾驶选项的新A8车型。

  AI大模型阶段(2020年至今):近年来,大规模的AI训练任务所需算力呈指数级增长,2012~2018年算力需求增长超30万倍,而超大规模预训练模型实现了算力突破,有效降低了AI应用的门槛。以Transformer为代表的大模型较CNN在大模型数据训练的优势更为突出,目前在自然语言处理领域几乎取代了RNN,并被引入计算机视觉领域,如特斯拉、华为、小鹏等均已宣布将Transformer引入自动驾驶感知框架。

  根据美国汽车工程师学会(Society of Automotive Engineers,SAE)的划分,智能驾驶技术依照自动化水平被划分为L0至L5共六个等级。其中,L3级被视作自动驾驶技术的分水岭,它象征着从辅助驾驶(L0至L2)向自动驾驶(L4和L5)的过渡。L3的核心差异在于监控环境的责任由驾驶员转至车辆自身,这一转变也意味着事故责任归属或发生重大变化。因此,L3在智能驾驶的发展进程中成为了一个关键。然而,伴随技术的不断进步,这种单纯的L0至L5分级方式已无法全面描述当前市场中的主流智能驾驶解决方案。许多主机厂开始探寻更为细致的分类方法,比如根据驾驶员对智能汽车的介入程度进行划分,分为毫秒级、秒级、分钟级和小时级别,以便更精准地反映智能驾驶的实际应用情况以及驾驶员的参与程度,而实现自动驾驶至少要毫秒级的反应精度。

  面对自动驾驶技术中L3级别的挑战,行业内部分化为两种技术策略。一类是采用自下而上做“加法”的渐进派,主要以特斯拉、小鹏等整车厂为主。该技术路线主要基于用户当前的实际需求,并适度引导用户需求,逐步实现自动驾驶功能。通过OTA(Over-The-Air,空中升级)软件迭代,这些功能能够自然演进,最终实现完全无人驾驶。这套模式比较注重成本效益,因此在硬件选型、供应链整合、制造水平等方面会投入较大精力。目前国内量产智能驾驶产品的实现以L2级别以及L2+级别智能驾驶为主,其中L2+级别主要包括NOA(导航辅助驾驶,Navigate on Autopilot)功能。另一类是采用自上而下做“减法”的跃进派,主要以Waymo、百度Apollo等科技公司为主。要实现这一模式的商业化落地,需要技术成熟度和完善的配套政策法规双重条件。在技术成熟度方面,无人驾驶面临的最大挑战是如何有效处理Corner Case。仅通过道路测试来穷尽所有Corner Case可能需要漫长的时间周期,这会导致全场景无人驾驶的实现时间变得不确定,此外还需要巨额的资金投入。尽管这两种路线在商业模式上存在显著差异,但随着技术的持续进步,两种模式的技术路径趋于交汇。

  目前,全球正处于L2级辅助驾驶向L3级别自动驾驶过渡的关键时期。L2级ADAS通过整合先进的传感器、摄像头和算法,为用户提供部分自动化辅助,如自适应巡航、车道保持和自动紧急制动等功能,显著提升了驾驶的安全性和便利性。随着技术的不断进步,L2级ADAS的渗透率在全球范围内持续上升,特别是在中国市场,搭载L2级功能的新车渗透率已达到较高水平。同时,业内也在积极研发和测试更高级别的自动驾驶技术,特别是L3级有条件自动驾驶。L3级自动驾驶能够在特定条件下实现车辆的完全自主驾驶,驾驶员可以在系统允许的情况下双手离开方向盘,但仍需在必要时接管车辆。多家车企和科技公司已在这一领域取得了显著进展,部分企业已获得L3道路测试牌照,并计划在2025年实现L3级自动驾驶的商业化应用。

  在政策的持续推动下,高级别智能驾驶技术的发展正逐步提速。2024年初的政府工作报告中特别指出“巩固扩大智能网联新能源汽车等产业领先优势”的重要性。6月4日,工信部联合其他三个部门确定了首批9家获得智能网联汽车准入和上路通行(L3级别)试点资格的企业名单,包括长安汽车、比亚迪、广汽、上汽、北汽蓝谷、一汽、上汽红岩、宇通客车和蔚来,涵盖了乘用车、货车和客车等多个领域。8月27日,在国务院新闻办公室举行的新闻发布会上,公安部交通管理局详细介绍了无人驾驶和自动驾驶汽车产业的最新进展,并特别指出公安部正在积极推进《中华人民共和国道路交通安全法》的修订工作。修订内容涉及自动驾驶汽车的道路测试、上路通行、交通违法处理以及事故责任追究等方面,旨在为自动驾驶汽车的合法运行提供明确的法律框架。目前,《中华人民共和国道路交通安全法》的修订已被纳入国务院2024年度立法计划,并被列为十四届全国人大常委会立法计划中的第一类项目。

  智能驾驶能显著减少人为因素导致的事故,提高道路交通安全水平。据CIDAS统计,乘用车的事故中有81.5%为驾驶人因素导致,其中驾驶员的主观错误导致的事故占比高达79.9%。智能驾驶汽车则不会出现违反交通规则、疲劳驾驶、酒后驾驶、疏忽大意等情况,能极大减少甚至消除因驾驶员违法违规操作、注意力不集中、驾驶经验不足、酒驾、醉驾等产生的道路交通风险。根据特斯拉公布的季度车辆安全报告,2024年Q3驾驶使用Autopilot自动辅助驾驶功能的车辆平均每708万英里才发生一起交通事故,而驾驶未使用Autopilot功能的车辆平均每129万英里发生一起交通事故,而美国境内大约平均每67万英里就发生一起车辆碰撞事故。

  智能驾驶正成为消费者购车的重要因素,65%以上的用户使用高阶智驾的频次超2次/周。燃油车和新能源汽车在多方面存在差别,而随着自动驾驶功能逐步上车,是否带有智能驾驶功能成为消费者购车的重要因素。虽然高阶智驾还处于刚起步的早期阶段,距离完全自动驾驶还有一定的距离,但还是有一部分消费者愿意为智能驾驶功能买单。据亿欧智库的调研数据,在配备高速NOA(领航辅助驾驶,Navigate on Autopilot)车辆的用户群中,有76.8%的用户每周使用高速NOA超2次,其中有35.7%的用户每周使用该功能高达8~10次;在配备城市NOA车辆的用户群中,有65.6%的用户每周使用城市NOA超2次,其中更是有25.0%的用户每周使用该功能高达8~10次。高阶智能驾驶目前并不能完全替代人类驾驶,但人们对智能驾驶的依赖度正逐步增强,相信随着功能的完善,自动驾驶在人们的驾驶场景中必不可少。

  2024年12月5日,外媒报道有部分车主收到了特斯拉史上最强FSD V13.2的更新版本,相比此前的V12版本,此次更新带来了功能、性能和技术上的重大提升。特斯拉FSD V13.2支持车辆在停车场内直接启动FSD功能,无需提前导航设置。车主只需在屏幕中输入目的地,车辆即可自动进入驾驶或倒车状态,实现从停车到行驶的无缝切换。新版FSD在智能化水平上也有显著提升,包括引入基于HW4.0硬件的高分辨率ISP图像处理器(每秒36帧),增强车辆在复杂场景下的感知与决策能力。此外,新版本支持新的速度配置模式,更灵活地适用于城市街道和高速公路驾驶。特斯拉在德州建设的超级计算机Cortex也为FSD提供了强大的算力支持。凭借5万张英伟达H100计算集群,FSD的AI训练速度提高了5倍,结合全球700多万辆特斯拉车主上传的实时驾驶数据,进一步加快了技术迭代进程。

  特斯拉FSD的快速发展对市场产生了显著的“鲶鱼效应”,中国车企和科技公司亦在加快布局。极氪在2024年6月初宣布浩瀚智驾获得上海市高快速L3自动驾驶测试驾照,并在7类场景、30余项科目的测试中获得了100%的通过率;在11月的广州车展上又推出了“浩瀚智驾2.0端到端Plus”架构,引入数字先决网络,具备道路先决、行为先决和时空先决能力,能应对复杂路况。小鹏在7月30日发布并全量推送了AI天玑XOS5.2.0实现了全国都能开,不限路线和地区,在环岛、狭窄、断头路等路况下也能实现自动驾驶。奇瑞发布了面向未来的高阶智能驾驶技术方案,进化大卓智驾C-Pilot 4.0到C-Pilot 5.0,标志着奇瑞智能车全面进入高阶智驾NOA元年。比亚迪董事长王传福在年初的股东大会上宣布未来将在智能驾驶领域投入1000亿元,聚焦包括生成式AI、大模型等在内的智能驾驶技术研发;12月24日,比亚迪高阶智能驾驶辅助系统“天神之眼”在全国范围内正式开通无图城市领航(CNOA)功能,不依赖高精地图就能实现城市道路导航和复杂路况预测。

  硬件成本不断下降,智能驾驶平权时代开启。一套支持城市NOA功能的高阶智驾系统典型配置包括:一个智驾域控制器(包含2颗英伟达Orin X芯片)、1颗激光雷达、3颗毫米波雷达、11颗高清摄像头(包含2颗8MP前视摄像头、4颗3MP周视摄像头、4颗3MP环视摄像头和1颗2MP后视摄像头)和12颗超声波雷达。随着技术路线的明晰与产业链的逐渐成熟,目前L2级以上智能驾驶的价格区间正在不断下探。据科瑞咨询数据,2024年1-10月,新能源汽车L2及以上渗透率在16~24万和8~15万两个价格带分别为74%和33%,较去年同期分别提升33pct和21pct。

  在智能驾驶领域,AI大模型、算力和数据是影响车企智驾能力的关键因素。AI大模型是智能驾驶系统的核心,决定了车辆对环境的感知、决策和控制能力;算力是支撑AI大模型运行的基础,决定了智能驾驶系统的处理速度和实时性;海量的数据能够帮助AI大模型更好地学习和适应不同的驾驶场景,提高系统的准确度和可靠性。

  AI大模型的发展与智能驾驶技术的演进之间已形成深度共生关系,从技术底层、系统能力到生态体系均实现双向赋能。智能驾驶初期(L1/L2),LLM(大语言模型)与推理能力为其带来语音交互优化与复杂决策支持,如ChatGPT驱动的车载助手可实现多轮对话理解,特斯拉FSD V12借助端到端大模型将事故率降低50%,同时智能驾驶产生的海量数据又反哺AI模型训练,形成数据闭环;当智驾技术向L3/L4阶段迈进,Agentic AI与GenAI的应用分别对应自动驾驶L4级突破及长尾场景破解,理想MindVLA架构融合空间智能实现精准3D环境感知,Waymo通过激光雷达方案拓展AI Agent的能力边界,小鹏XNet运用合成数据模拟极端场景;到L5阶段,组织型AI与完全自动驾驶将实现城市级联动,百度Apollo的VTA模型探索车路云协同调度数百万自动驾驶单元,自动驾驶产生的PB级多模态数据(如视觉、雷达等)为AGI的演进提供复杂的现实训练场景。这种共生关系体现为智能驾驶既是AI技术的试验田(每年产生800EB数据)与AGI的验证场景,又借助阶段性AI突破推动自身从单车智能向群体智能转变。

  传统自动驾驶算法采用模块化部署方式,功能实现依赖众多独立小模型的叠加。其中,感知模块作为自动驾驶车辆的“眼睛”,借助摄像头、毫米波雷达、激光雷达等各类传感器收集车辆所处环境信息,并转化为数字信号传输至车载计算机;决策规划模块如同“大脑”,运用机器学习、深度学习、神经网络等算法,分析感知信息,预测移动障碍物轨迹,规划最佳行车策略并发出指令;控制模块则相当于“四肢”,依据指令通过控制单元完成车辆的启停、加减速、避让、转向等操作。在模块化运作模式下,各模块算法彼此独立,模块内各项功能的达成依靠众多小模型层层堆叠。

  在应对大量“Corner Case”(极端情况)时,模块化算法暴露出泛化性欠佳的问题。其运作模式虽便于算法问题回溯以及模型调试迭代,却因任务解耦导致各模块相对最终驾驶规划目标存在信息损耗,加之模块间优化目标不统一,误差传递,致使传统模块化部署结构出现累积错误或任务协调不充分等状况。不仅如此,一旦遭遇高精地图未覆盖或路况极为复杂的情形,由于整个系统极为复杂庞大,需人工设计成百上千个优化目标各异的模块(每个模块可视为一个小模型,如感知检测侧重平均精度,规划追求驾驶安全舒适),各模块误差不断加剧,最终不仅加重算力负担,还需耗费大量精力处理“Corner Case”。

  基于AI大模型的端到端自动驾驶算法已成为未来行业发展的必然趋势。与传统方案不同,端到端自动驾驶方案创新地将感知、决策规划以及控制等所有环节深度融合,构建起一体化模型体系。在实际运行中,该方案可将传感器采集的环境信息,直接导入统一的深度学习神经网络,经过高效运算处理,无需复杂中间步骤,便能迅速生成精准的驾驶命令。这一方案以单个大模型之力,完美承接了传统模块化架构下众多小模型协同才能达成的功能。从误差控制角度来看,它彻底规避了传统多模块“流水线”作业模式下因环节衔接导致的误差层层累积问题,大幅提升了系统运行的准确性与稳定性;从资源利用和研发效率层面分析,端到端模型实现了资源的高度集中与功能聚焦,研发人员无需再分散精力应对多个模型,仅需专注于这一个大模型的训练与优化,便能达成系统性能提升,极大地简化了研发流程,减少了大量繁琐且重复的工作任务。

  特斯拉作为全球智能汽车领域的翘楚,其在智能驾驶算法方面一直处于领先地位。该公司的自动驾驶技术经历了四次重大的技术革新,每一次都标志着其在自动驾驶领域的进步和突破:

  2013~2018年:2D直视图+CNN,采用后融合的环境感知方案。早在2013年,特斯拉开始探索智能驾驶技术,并在2014年10月与Mobileye合作。2016年起,特斯拉开始自研智能驾驶算法。当时主流自动驾驶算法为“2D直视图+CNN(卷积神经网络)”,即2D图像等感知数据通过CNN进行后融合,通过大量计算统一升到3D。但CNN算法存在一定的局限性:一是需要大量标注驾驶数据进行训练,而获取足够多样化数据具有难度;二是后融合对算力的需求较大,泛化性能有待提高;三是后融合存在精度不高、高度和深度信息不准确。

  2019~2020年:引入BEV(鸟瞰图视角,Bird’s Eye View)+Transformer算法,采用特征级融合取代后融合。BEV可以生成围绕车辆的俯瞰图,其主要的作用是推动2D图像向3D车身子坐标系转变,避免前视放射视角下的尺度、遮挡等感知问题,从而提升感知精度。Transformer是一种基于自注意力机制的新型神经网络架构,可挖掘不同元素之间的联系和关联以提取多模态数据特征,同时并行训练数据,因此其更适应不同长度和结构的数据输入,可直接实现2D、3D不同序列的转换。基于这一架构,特斯拉在BEV空间层中先初始化特征,再通过多层的Transformer和2D图像特征进行交互融合,最终得到BEV特征。

  2021~2022年,在BEV+Transformer的基础上引入占位网络(Occupancy Network)。2022年,特斯拉引入Occupancy Networks,它可直接感知3D空间中的体素(Voxel),即将周围环境划分为多个大小相同的立方体,进而判断是否存在障碍物,识别速度快、感知效率高、空间识别结果更精准。BEV+Transformer+Occ算法大幅提升了纯视觉方案的感知能力,带动感知范围、精度、维度、稳定性等多方面效果大幅提升,应对复杂道路、恶劣天气、动态交通的能力增强。同时,在BEV空间层中,多模态数据统一调整为以自车为中心的同一坐标系中,规控模块提取更高效,为“端到端”大模型打下基础。占用网络的核心作用在于解决长尾问题,大幅提升了自动驾驶算法的泛化能力,进一步推动去高精地图化。我们看到国内车企迅速跟进,目前头部车企大多在感知层已切换至BEV+Transformer模型,但规划决策端神经网络化仍相对滞后。

  2023年8月:特斯拉提出“端到端”大模型上车。所谓“端到端”,指的是信息从一端输入,直接从另一端输出,全程无需在各个模块间来回传输,一站式即可完成全部流程。从专业角度来讲,它是基于同一神经网络,从原始传感器数据输入,直接到控制指令输出的连续学习与决策进程,不涉及任何显性的中间表示,也无需人为设计模块,彻底告别了工程师编写无穷无尽代码的繁琐模式。“端到端”依托深度卷积升级网络模型开展深度学习,不仅感知层(输入部分)借助模型得以实现,规划决策层(输出部分)同样通过模型达成,将感知和决策模块融合在了同一个模型之中,同时,其另一个核心理念在于确保信息无损传递,为迈向L4级无人驾驶提供了广阔的想象空间与实现可能。

  VLA模型开启端到端自动驾驶新范式。VLA(Vision-Language-Action)模型作为端到端架构的2.0版本,通过深度融合视觉(Vision)、语言(Language)与动作(Action)模态,显著提升了系统的场景理解与决策泛化能力。该架构突破了过去端到端1.0与视觉语言模型(VLM)分立协作的局限性,通过统一模型参数实现复杂场景的长时序推理(如潮汐车道、动态路权分配)。比如在推理时长上,传统rule-base方案下,智驾只能推理1秒钟路况信息然后做出决策控制,端到端1.0系统能够推理出未来7秒的路况,而VLA能对几十秒路况进行推理,为L4级自动驾驶的推理密度需求奠定基础。

  头部企业已启动VLA模型的技术验证与预研布局。国外方面,谷歌旗下自动驾驶公司Waymo推出的多模态模型EMMA通过整合地图指令与实时感知数据,验证了VLA架构的可行性;英国初创公司Wayve率先布局,其此前基于VLM的方案已积累经验,扩展至VLA,Wayve的无图化思路与VLA的实时感知能力高度契合,或将成为欧洲市场的先行者。国内方面,2025年3月18日,理想汽车在NVIDIA GTC 2025上分享了其对于下一代自动驾驶技术MindVLA的最新思考和进展。MindVLA基于自研的重建+生成云端统一世界模型,深度融合重建模型的三维场景还原能力与生成模型的新视角补全,以及未见视角预测能力,构建接近真实世界的仿线开始设计和训练了适合MindVLA的LLM基座模型,采用MoE混合专家架构,引入Sparse Attention(稀疏注意力),实现模型稀疏化,保证模型规模增长的同时,不降低端侧的推理效率。面对部分长尾场景,理想建立起人类偏好数据集,并且创新性地应用RLHF(基于人类反馈的强化学习)微调模型的采样过程,最终使MindVLA能够学习和对齐人类驾驶行为,显著提升了安全下限。

  随着VLA技术路径逐渐明确,智能驾驶的竞争焦点将进一步向车端算力、数据闭环效率与多模态知识迁移能力倾斜,或将加剧行业的马太效应。一方面,VLA模型的规模化落地仍受制于车规级芯片算力不足。当前,高阶智驾平台普遍采用双Orin X方案(508TOPS),而VLA的实时推理需依赖单片算力超1000TOPS的下一代芯片(如英伟达Thor),同时需要平衡算力成本(单片700TOPS版本或需双芯叠加),这对车企的硬件选型和成本控制提出严峻挑战。另一方面,开源大模型与互联网语料库为VLA提供了低成本的知识蒸馏路径,但如何将通用语义理解无缝嵌入驾驶决策链仍需攻克跨模态对齐难题。我们认为VLA的演进或将加剧行业马太效应:头部玩家凭借芯片协同研发能力与先发数据积累,有望在2025~2026年窗口期形成代际差,而后发者受限于算力供给滞后与模型调优复杂度,技术追赶窗口持续收窄。

  高阶智驾落地依托于高算力芯片,车端算力将持续升级。L2级以下的自动驾驶辅助功能所需数据量较小、算法模型较简单,小算力芯片与算法强耦合即可满足车企需求。而L3级以上智驾系统的传感器数量和分辨率提升增加了海量数据处理的需求,提高了模型算法的复杂度。参考小米汽车发布会的数据,特斯拉Model 3换新版所搭载的HW4.0算力为720 TOPS,相比HW 3.0的144 TOPS提升了5倍。长期来看,随着大模型上车对车载算力需求的进一步提高,以及车载芯片厂商对芯片架构和技术的改进,车端算力有望持续提升。

  车企积极推行“先硬后软”的预埋策略。为保证车辆在全生命周期内具备软件持续升级的能力,车企一般通过预埋大算力芯片为汽车软件与算法的持续升级提供足够发展空间。特斯拉、理想、蔚来、智己、威马、小鹏等车企的最新车型中均将车端算力提升至500~1000TOPS。

  车端算力芯片由海外厂商主导,自主厂商后劲十足。目前车端算力芯片的主流供应商包括以英伟达、特斯拉、Mobileye等为代表的海外厂商和以华为、地平线、黑芝麻智能等为代表的自主厂商为主。根据盖世汽车的数据,2024年1-10月海外厂商(英伟达39.0%、特斯拉25.4%、Mobileye 6.7%、TI 2.6%、高通2.2%)市占率为75.9%,较2023年全年下滑8.8pct;自主厂商(华为9.6%、地平线pct。

  数据驱动下,自动驾驶新一轮的军备竞赛将在云端算力展开。对于所有算法而言,算力就是AI的基础,对于自动驾驶而言亦是如此。随着自动驾驶算法由规则驱动向数据驱动转变,智能驾驶算法训练时所需数据量呈指数级增长,训练所需数据多为2D、3D甚至是视频片段,这对存储空间和计算资源都消耗巨大。为此,国内外自动驾驶领先车企均围绕云端算力展开军备竞赛。目前,主机厂特斯拉、理想、小鹏、吉利,解决方案提供商毫末智行、商汤、百度均布局建设了算力中心,用于自动驾驶等大模型的训练。

  智算中心的建设能够显著加速算法迭代,提高自动驾驶研发效率。例如小鹏汽车的扶摇智算中心算力达到600PFLOPS(浮点运算60亿亿次/秒),与之前相比,自动驾驶模型训练速度提高了170倍,GPU资源虚拟化利用率提高了3倍,端对端通信延迟低至2微秒;吉利汽车的星睿智算中心算力达到810PFLOPS,智驾模型训练速度提高200倍以上。我们认为,随着高阶智能驾驶渗透率的提升,大模型或将成为各公司的核心竞争力之一,为匹配模型中大规模参数以及大数据量计算,智算中心的建设规模有望持续扩张。

  算力布局提高了前置成本,天然抬高了智驾kaiyun体育全站 Kaiyun登录网页算法自研的门槛。据地平线估计,端到端的初级算力建设门槛或为1000块英伟达A100,即19.5PFLOPS算力,而想要实现极致的自动驾驶功能和性能体验,则需要远高于此的算力支撑。目前车企云端算力的布局主要有三种路径:一是车企自建算力中心。适用于资金雄厚的车企,例如特斯拉,据公司披露的数据,截至2024年Q3,特斯拉拥有的H100数量已超6万张,预计到2024年底,公司算力规模有望接近9万张。二是车企与智能计算云服务商合作。例如阿里云、腾讯云、火山引擎等云计算企业以云服务模式向车企提供算力资源及技术服务。三是公共智能计算中心。公共智算中心以地方政府主导建设为主,主要支撑当地车企、科技企业、科研机构和高校的人工智能技术与应用创新。无论是自建还是与云服务商合作,车企需要在算力布局方面花费大量前置成本,这对车企的资金及渠道能力提出挑战,利好实力雄厚的领军玩家。

  随着端到端自动驾驶时代的到来,数据的重要度大幅提升。在传统基于规则的算法时代,工程师将驾驶行为的执行细节转化为规则,并嵌入到自动驾驶算法中。当算法出现问题时,只需修改或增加新的规则,就能实现对算法的优化。然而,在端到端自动驾驶算法中,模型主要通过分析驾驶视频片段来学习驾驶行为和对环境的理解。因此,将人类希望模型掌握的知识融入数据,并确保模型在训练过程中能够吸收这些先验知识,是一项更具挑战性的任务。根据毫末智行的报告,数据在端到端自动驾驶开发中的研发成本占比将超过80%。

  量大质优的数据成为高阶智驾时代的“稀缺品”。从量的角度来看,L2级别的自动驾驶需要4~10PB的数据和1000~5000核的计算资源;L3级别的ADAS系统,需要50~100PB的海量数据和5000~25000核的计算资源;要想实现L5级别完全自动驾驶,需要超过2EB级别的数据量。从质的角度看,高质量数据的输入,直接决定了模型输出的准确性和可靠性。这些数据不仅需要涵盖各种道路条件、天气变化和交通情况,还要确保其标注的准确性和多样性。

  智能驾驶数据目前主要来源于“数采车”或量产车采集的真实数据。在国内,较为主流的办法仍是使用测绘车来进行道路数据采集,由具备甲级资质的第三方单位派遣测绘人员坐在主机厂或自动驾驶厂商的“数采车”上进行数据采集,在经过脱敏合规处理后再将数据交予客户进行训练。通过“数采车”进行数据采集的方式成本极高,车企在销量达到一定规模后均会转向量产车采集数据,最典型的就是特斯拉的“影子模式”。即大模型在车辆后台运行,模拟决策而不实际控制车辆,不会对驾驶者及车辆产生任何干扰,但是在有异常情景或模型与人类驾驶员的决策不同时触发数据采集和回传,使得量产车即等同于“数采车”。

  需求与供给的错配推动生成式AI在自动驾驶的重要性日益提升。从需求端来看,随着自动驾驶走入“深水区”,玩家对数据的要求日益提升,厂家希望数据能够包含复杂交通流、具有丰富的场景以及各类长尾问题、并且具备3D标注信息。但从供给端来看,当前数据采集的成本居高不下,部分危险的场景如交通事故等难以采集,长尾场景极度稀缺,同时3D标注的成本高昂。因此,采用合成数据来助力模型训练测试成为颇具前景的发展方向。生成式AI可自动生成道路场景、车辆、行人等信息,并对量产车采集到的corner case进行反复模拟和训练,从而弥补现实场景采集信息不足的问题。

  如何实现数据闭环是特斯拉与国内车企在自动驾驶领域最大的差距之一。数据闭环是指采集汽车驾驶过程中的复杂场景数据,并进行回传、标注、清洗,传输至算法模型中进行训练,并将新模型部署至车端运行循环验证的过程。特斯拉经过多年积累,目前已构建了一套完整的工业化数据训练流程,包括数据采集、训练、标注、黑白测试等流程闭环。目前,国内部分车企尚未搭建好量产车数据闭环的流程,有些主机厂虽然搭建好了流程,但数据也并未很好地用于深度学习模型的迭代。我们认为即便是小鹏、华为等国内领先玩家,在数据闭环效率方面也落后特斯拉1-2年时间。

  高阶智驾的发展或将导致整车企业的商业模式发生变化,进而影响汽车行业的竞争格局。在硬件逐渐成为标准品,卖车难以获取高溢价的背景下,传统车企即便销量较高,利润率却依旧偏低。通过将高阶智驾与量产车相结合,特斯拉成功构建了双飞轮效应。一方面,其卖车业务遵循薄利多销策略,借助产品设计进行改进、优化供应链管理以及扩大产能等手段,持续降低车型的成本,进而降低产品售价,刺激销量增长;另一方面,自动驾驶服务被视为未来盈利的核心增长点,销量的提升意味着用户数量的增加,这将为特斯拉带来更丰富的行驶数据,有助于完善智驾算法,优化自动驾驶体验,从而进一步提升用户的付费意愿。

  我们认为智能汽车与智能手机的市场格局演变的驱动因素具有一定的相似性。在技术导入期,由于进入门槛低、已有产品竞争力差,入局者众多带动市场格局趋于分散。2016~2018年,新能源汽车技术变革开启,传统燃油车企反应速度相对落后,比亚迪加速推进新能源车型上市,北汽新能源、知豆、众泰等车企纷纷布局,市场集中度趋于分散,CR3/CR5/CR10分别从2016年的59.6%/77.2%/96.4%下滑至2018年的34.9%/43.3%/57.1%。在技术收敛期,主要考察参与者的规模效应和降本能力,技术变革让资格赛变为淘汰赛,逐步带动市场格局集中。2019~2024年,新能源汽车行业进入高速增长期,电动化技术逐步成熟、产品力提升,高度依赖补贴、缺乏核心竞争力的车企逐步出清。此时,产品力、规模效应和降本能力成为核心竞争要素,带动市场格局逐步收敛,CR3/CR5/CR10分别从2019年的36.6%/47.4%/64.1%提升至2024年的48.1%/59.7%/77.9%。

  根据智驾能力的差异可将车企分为三梯队。第一梯队是软硬全栈自研模式。以特斯拉为代表,智驾芯片和算法全栈自研。一体化自研使得软硬件的适配性更好,可以用更低的性能参数实现系统性能最优(低成本的一种实现方式),品牌效应叠加规模效应下,盈利能力也将领先于行业平均水平。第二梯队是软件自研硬件外购模式。以现阶段的蔚小理(蔚小理为代表的国内新势力正努力向软硬全栈自研发展)、小米、吉利、长城、长安等为代表,智驾芯片外部采购,智驾算法自研(或与供应商联合开发)。芯片企业利用规模优势提供性价比的芯片,车企利用算法和功能定义实现产品的差异化,在该模式下车企主要赚取车的硬件利润和软件收益。第三梯队及以下需完全借助外部系统解决方案。由于车企自身芯片级算法能力均较弱,需要借助第三方供应商提供系统级解决方案,典型代表如与鸿蒙智行合作的车企。由于产品和功能定义权在解决方案供应商手中,因此在该模式下车企主要赚取车的硬件利润以及少量软件分成。

  智能驾驶有望引发汽车行业新一轮淘汰赛。我们认为智能驾驶对销量的贡献是一个渐进的过程,随着L2+功能逐步成Kaiyun平台 开云体育官方入口熟,消费者使用频次提升、体验优化,智能驾驶对消费者购车决策的影响力将逐渐放大,智能驾驶“有没有”和“好不好”将更直接地影响车型销量。根据乘联会的数据,2024年整车市场中自主品牌的份额呈现明显的“微笑曲线万以上价格带车型中自主品牌占据绝对优势,而在15~25万价格带车型中自主品牌与合资品牌的竞争仍处于焦灼状态。对中低端市场而言,消费者对智驾的付费意愿不强,智驾方案主要以第三方为主,但能力突出的自主车企有望搭载相关功能打造差异化的优势,借此巩固市场份额;对中高端市场而言,车企/品牌需要突出智能化的长板,智能驾驶对中高端市场格局的影响或更为显著,自主品牌车企可凭借软件算法自研提升市场份额,而智驾能力较弱的中高端合资品牌或将被淘汰出局。

  自主品牌车企在高阶智驾中处于领先地位,纯视觉和多传感器融合两条技术路线并行。据NE时代数据,在2024年搭载NOA功能车型销量前10的品牌中,除特斯拉销量排名第一外,其余均为自主品牌。国内车企实现高阶智驾功能目前有两条技术路线,即纯视觉和多传感器融合。特斯拉是纯视觉路线的倡导者,主要依赖摄像头和计算机视觉算法实现环境感知,与人眼观察环境类似。由于国内车企在视觉感知算法技术较弱,叠加国内城市道路路况复杂,纯视觉难以满足当前城市NOA所要求的高精度和低时延,因此国内车企多采用多传感器融合路线。多传感器融合路线是将摄像头的图像数据与Lidar(激光雷达)的点云数据充分融合,能够有效提升环境感知的精度和抗干扰能力,提高智驾系统的稳定性。据NE时代数据,2024年搭载城市NOA高阶智驾功能车型的传感器方案中纯视觉占比为32.1%,多传感器融合方案占比58.4%。我们预计激光雷达的成本仍有下降空间,部分车企也愿意保留Lidar以提升消费者对车辆安全性的感知,因此在中期维度,高阶智驾中纯视觉和多传感器融合路线会保持并行。

  比亚迪天神之眼加速智驾全面落地,创智驾平权时代。比亚迪宣布将于2025年2月10日召开智能化战略发布会,将发布“天神之眼”高阶智驾系统,旨在通过技术创新降低智能驾驶使用门槛。比亚迪此次智能化战略发布会重点介绍了其天神之眼C智驾系统,其感知系统包括12个摄像头、5颗毫米波雷达、12颗超声波雷达。在功能方面,天神之眼C可以实现高速NOA、智能泊车以及城区记忆领航(据发布会介绍,城区记忆领航功能预计在2025年底通过OTA实现)。天神之眼C所实现的功能大多数车企均已实现,但天神之眼更大的意义在于使得高速NOA功能实现了20万元以下车型的全覆盖,掀起全行业进入“智驾平权”新时代。

  车企在智驾领域的自研能力存在分化,第三方供应商仍有较大的生存空间。不论车企的自研能力如何,都需要供应商来参与,只是对供应商的需求不同。一梯队的车企一体化自研,但需要供应商满足硬件代工的需求。例如特斯拉的自动驾驶域控制器需要由和硕/广达代工生产。二梯队的车企自研能力较强,但仍需要供应商提供含基础软件模块的域控硬件以及部分软件算法模块。三梯队的车企自研能力弱,需要供应商提供包含软件算法+域控硬件的全流程解决方案,例如华为通过鸿蒙智行模式为赛力斯等车企提供全流程的智能驾驶解决方案。

  第三方智驾供应商与车企的合作主要有三种模式。第一种是Tier 0.5模式。这种模式最典型的代表是引望(原华为车BU),主要通过三种形式与车企进行合作,由于引望拥有自研的Lidar,因此目前主推带Lidar的高阶智驾方案。第二种是Tier 1模式。这种模式下供应商主要为车企提供域控硬件、软件算法、软件+域控的解决方案。域控硬件:以德赛西威为代表,凭借与英伟达的长期合作占据国内Orin智驾芯片配套域控的多数份额;软件算法:以Momenta为代表,搭配英伟达主攻中高端市场,目前供应上汽智己和比亚迪中高端车型等,据佐思汽研数据,Momenta在城市NOA第三方智驾供应商的市占率高达60.1%;软件+域控:以卓驭(大疆旗下智能驾驶业务品牌)为代表,软硬一体可有效压缩成本,凭借全套低成本智驾方案(估计约5000~6000)有限抢占中低端市场,目前供应大众、宝骏、比亚迪中低端车型等。第三种是Tier 2模式。国内供应商以地平线为代表,海外厂商以英伟达为代表,主要为车企/域控厂商提供智驾芯片。目前英伟达占据域控芯片60%以上的市场,地平线的征程系列芯片是目前出货量最高的国产智能驾驶芯片。

  合资车企与国内智驾供应商的双向奔赴,有望打开智驾出海的新局面。合资车企在智能驾驶的技术储备不足,为满足中国市场对智驾功能的强烈需求,并在当下极度内卷的竞争环境中维持市场份额,合资车企纷纷转向与国内第三方智驾供应商合作,以期能快速落地好用的智驾功能。总结来看,合作形式主要有以下三种:一是成立合资公司,获取深度且全面的技术赋能。例如大众汽车集团旗下软件公司CARIAD与地平线成立合资公司CARIZON,加速了大众智能化产品的市场布局。二是以股权投资为基础,进而使用被投企业的智驾解决方案。例如梅赛德斯-奔驰和丰田分别参与了Momenta的C轮和C+轮融资。三是通过正常的供应商准入、项目招标和定点。例如2024年5月大众汽车与卓驭科技(原大疆车载)双方首款合作车型途观L Pro上市。我们认为国内领先的智驾供应商与合资公司的合作是一种双向奔赴,一方面合资车企可通过国内供应商的智驾解决方案快速提升车型产品力,另一方面国内供应商也可凭借与合资公司的合作熟悉海外车企的定点决策流程和节点,并以此进入全球供应商候选池,有望推动出海合作。

  一般通过渗透率来划分产业的成熟度,将整个产业发展周期分为行业导入期、行业成长期和行业成熟期。(1)行业导入期,渗透率<10%。这个时期的核心特征是技术并不成熟,市场认知度低,商业模式也未经验证;市场需求主要以政策驱动或者尝鲜用户为主,渗透率一般低于10%,例如2020年之前的新能源汽车。(2)行业成长期,渗透率快速提升阶段。这一时期的核心特征是技术路线趋于收敛,市场接受度大幅提升,规模效应逐步显现;行业发展由政策驱动转向市场驱动,需求端由B端向C端扩散,渗透率一般在10%~65%之间,行业持续洗牌(价格战),当前新能源汽车正处于这个阶段。(3)行业成熟期,渗透率提升速度减缓或震荡。此时行业的核心特征是市场趋于饱和,处于存量竞争状态,且竞争焦点转向成本与差异化,渗透率>65%,当前智能手机行业正处于此阶段。

  我们认为智能化将接棒电动化,高阶智驾即将进入行业成长期。从技术层面来看,算法从基于规则到BEV+Transformer再到BEV+Transformer+Occ,最后收敛至端到端;从需求层面看,市场对智能驾驶的接受度大幅提升,消费者从尝鲜用户向大众用户转变;从竞争格局来看,电动化的竞争目前趋于同质化,而智能化是当前车企争夺技术领导力、打造产品差异化的利器,而智能驾驶正是车企在智能化战役中的重要抓手,例如比亚迪的产品策略从2024年的“电比油低”转向2025年的“智驾平权”,计划在2025年的销售车型中至少60%能够搭载高速NOA及以上的智驾系统。从渗透率来看,据亿欧智库的数据,2024年我国高阶智驾(高速NOA+城市NOA)的渗透率达到8.5%,预计高阶智驾在2025年的渗透率将达到16%,高阶智驾将从行业导入期正式迈向行业成长期。

  一是智驾技术变革的风险。一方面,智能驾驶功能的落地情况和使用体验和智驾技术发展高度相关,若技术发展不及预期将对智能驾驶产业链产生负面影响;另一方面,智能驾驶技术尚未完全成熟,技术路线存在变革的可能性(如纯视觉路线和多传感器融合,高精地图与去高精地图,单车智能与车路云协同等),商业银行应及时跟踪技术发展路径及其对产业链的影响。

  二是市场接受度不急预期的风险。智能驾驶的商业推广取决于消费者对其的接受程度。如果车企对消费者的营销宣传、功能介绍、使用指南上没有很好的实施,以至于消费者不买智驾配置,或是购买了不会用,则对智能驾驶长期商业闭环和反馈数据采集都有比较负面的影响。

  三是法规政策不及预期的风险。自动驾驶行业发展离不开政策层面的支持与推动。L3有条件自动驾驶的测试准入标准和L4 Robotaxi的推广,例如允许收费运营的城市、Robotaxi需要的安全员数量等,都需要法规的明确规范以及政策支持。因此,若相关法规出台进度或是力度不及预期或将影响L3功能和Robotaxi的落地进程。

  四是市场竞争加剧的风险。智能驾驶产业即将步入成长期,市场竞争异常激烈,目前新势力车企处于领先地位,但以比亚迪为代表的传统车企和以百度为代表的科技企业亦在参与竞争。比亚迪将于2025年2月10日召开智能化战略发布会,重磅推出“天神之眼”高阶智能驾驶系统,有消息称比亚迪计划将“天神之眼”下放至10万元级别车型,加量不加价的“智驾平权”战略将加剧中国智能驾驶技术的竞争。

普惠AI,造就美好生活