最近,懂车帝发布了年度高阶智驾横评,36台车齐上阵,结果一夜刷屏。最炸裂的结论是:除了特斯拉,几乎没有一台车能“通过”测试。评论区吵成一片,有人说“国内智驾不行”,也有人觉得“测试不合理”。但如果你稍微往深了看,会发现这不是个“车不行”的问题,而是测试标准本身就脱离了现阶段智驾定义。
一、这不是L2该做的测试,别用L4的尺子去量L2
这场测试的“难度级别”,其实已经超出了大多数智驾系统的定义范围。从懂车帝公开的视频来看,多数测试场景涉及突发加塞、鬼探头、夜间无灯路口、高速拥堵突变等典型“极限情况”,这些场景在ISO 23374与SAE J3016定义中,显然属于L3及以上级别才需要系统完全承担驾驶决策。
根据SAE标准,L2系统仅提供横向+纵向控制,但需由驾驶员全程监控并对突发情况负责。而懂车帝的测试核心,显然更接近于对“L3-L4主动决策能力”的压测。例如:
1,狭窄道路双向会车”测试,需系统自主规划避让路径;
2,非机动车突然冲出”场景,需结合环境预测与主动刹停;
3,道路不规整、标线缺失”时,需要完整环境感知、地图重构。
这些能力,目前仅有部分高阶NOA或L3预备系统具备雏形。因此,把L2级产品放入类似“提前考研”的测试中,测试本身超纲,是问题的核心。你让一个还处在“陪练”角色的系统去应付“科目五”?结果可想而知。
所以,测试本身并不适用于评判“当前量产系统是否成熟”,而是提前为L3甚至准L4打了靶。把L4题目丢给L2同学,大家都挂了,只有特斯拉“交了白卷”但没被扣分,看起来就成了“第一”。
但这合理吗?如果你站在量产定义和工程能力的角度看,确实不合理!
二、特斯拉“第一”,靠的是架构不是反应力
特斯拉确实是唯一一台“通过测试”的车型,但它也不是“做得最漂亮”的那个。恰恰相反,在多次紧急场景中,它的策略是:判断不明,立即停车。这不激进、不聪明,甚至有些“怂”。
但它有一点强:稳定、统一的架构策略。FSD基于全视觉方案(纯视觉感知+神经网络决策),其最大优势是泛化能力强。换句话说,它可能看不懂这个场景,但它的模型已经学会了“看不懂就停下来”,而不是出错。
所以并非国内品牌“技术落后”,而在于FSD路线本质不同:端到端行为克隆系统的AI架构。
特斯拉FSD的三大架构优势:
BEV感知融合模型(Bird's Eye View)+Transformer结构,使系统能对环境进行三维动态建模;
端到端大模型决策,跳过传统感知-融合-决策-规划-控制四级架构,减少模块延迟和错误累积;
行为克隆模型基于200亿英里+真实用户驾驶数据训练(截至2024年底),具备泛化能力,可“临场学习”判断非预设情况。
测试中可见,它面对风险动作更趋于保守,选择静止等待或让行,避免激进博弈行为。这使它在极限测试中“避免失误”,却在中国城市复杂、效率导向的驾驶环境中显得“犹豫”甚至“笨拙”。
例如,在广州、上海等城市道路实测中,FSD对插队摩托、电动车、红绿灯拥挤复杂交叉口的处理效率,仍低于本地头部系统(如华为ADS等)。
三、国内智驾,90%的路都开得不错,剩下的10%不是错,而是定义不同
必须承认,在日常使用场景中,国内智驾已经非常成熟。小鹏、华为、问界、智己、蔚来,甚至零跑的智驾系统在高速、快速路、简单城市道路中都表现稳定,识别率、跟车、变道、转弯都在可控范围内。尤其在城市NOA和无图化能力上,小鹏、华为、阿维塔、智界这些品牌已实测落地。
这意味着,国内系统虽然“极限场景”不如特斯拉稳,但在日常使用的舒适性和判断合理性上,表现并不差,甚至更符合中国交通现状。
以2025年Q2的最新城市NOA落地情况为例:
华为ADS 3.0/4.0:已支持全国300+城市、城区道路脱图通行;
小鹏XNGP:在多城市实现无高精地图NOA,基于Fusion SLAM感知建图能力;
理想AD Max:2025年初宣布城市NOA将全面脱图,并引入端到端感知推理模块;
蔚来NOP+:覆盖城市快速路、高架路+部分城市街区,采用BEV建图+预测模型;
阿维塔、极氪等二线智驾方案也已陆续推向城区NOA。
目前,国内多数高阶NOA系统在驾驶行为更贴近本地路况驾驶者,但在“极端规避策略与未知变量处理”方面,尚未完成端到端模型迁移,系统仍偏“指令式执行+规则博弈”。
为什么测试中很多车“犯错”?说白了,是“太积极”了。中国智驾系统普遍“偏主动调整”,甚至在规则允许内积极寻找最优路径,这样的风格在日常城市路况很流畅,但遇到鬼探头、加塞等极端情况时,容易“走进陷阱”。
所以不能简单说国内车厂不行,而是:架构风格不同,定义方式不同,训练场景也不同。
四、路线之争的底层,本质是:谁能快速适配 AGI 的发展红利
目前国内智驾系统大致分两派:融合感知+规则决策派(主流国内车厂),和纯视觉+大模型派(如特斯拉FSD Beta、百度Apollo端到端尝试)。
短期看,融合派更稳,感知精度高;但长期看,端到端、模型自学习能力强的架构更有潜力。因为未来的智驾,不是单点突破,而是AI主导下的综合行为建模——也就是AGI的一个分支。

AGI(通用人工智能)一旦成型,智能驾驶将不再依赖人工标注规则或预定义边界,而是通过大模型自身进化来完成“意识建模”。而实现AGI路径的三个核心条件:
1,超高算力支持
2,稳定高速的数据传输通道(如星链)
3,统一数据闭环训练平台
特斯拉FSD目前在做的,就是沿着这条路径走。虽然它在中国实际路况下泛化效果尚不理想,但它的架构预期是通向未来的,这点值得尊重。
五、智驾是AGI的先行军,中国应将其纳入国家战略体系
这次懂车帝测试,其实反向证明了一件事:我们需要有更统一的标准、更清晰的战略路径来定义“什么是智能驾驶”。在中国这个地形复杂、交通规则弹性高的环境中,智驾系统的发展不仅是商业问题,更是技术体系、AI应用与算力安全的问题。
随着智驾系统向AGI演进,基础模型将不再局限于某一款车、某一条路,而成为智能交通系统的组成,但同时也面临三大挑战:
1,芯片与算力依赖:高阶推理模型对GPU、TPU需求巨大;
2,数据安全与标准制定:多模态采集将触及城市结构、用户隐私;
3,模型训练与伦理问题:模型行为如何解释?极端场景下谁来承担责任?
考虑到全球芯片发展趋于瓶颈、海外技术封锁风险与训练平台受限,我们必须将AGI及其分支路径(如智能驾驶、机器人、工业控制)提升为国家战略方向。这不仅关乎车厂竞争力,更关乎算力自研、模型闭环、安全可控。
华为已经用ADS 4.0喊出“WEWA世界行为模型”的概念,小鹏也开始布局大模型与端到端驾驶融合。这些都说明:中国车厂在尝试“迈出驾驶AGI的第一步”。
所以,回看懂车帝测试,我们不是要否认它的价值,而是要明确:这不是一场L2级别该有的测验,而是一份L3.5-L4的“超纲”期末考。特斯拉的“通过”不是智驾完美,而是策略保守;其他车的“失误”也不是系统混乱,而是太想“做点什么”。
眼下的城市NOA、无图驾驶,确实都在逼近L3门槛,而未来,只有掌握AGI时代“感知-认知-行为”一体化核心架构的厂商,才有机会冲出重围,真正n站上世界舞台。
渝公网安备50010502503425号
评论·0