智驾卷到现在,很多人已经被各种术语绕晕:端到端、大模型、世界模型、VLA……但落到日常用车,用户只关心两件事:开起来安不安全、好不好用。长城这次把全新大模型智驾——VLA,直接装上魏牌蓝山智能进阶版,有意思的地方就在于一句话:AI越“害怕”,驾驶越安全。
先看实际表现,再谈技术逻辑,会更好理解长城想干什么。
这次长城选择在保定的新老城区公开测试长城VLA,路线不挑不避:快速路、人车混行老街、无保护路口、施工路段、大型路口,全都是城市里最容易出幺蛾子的地方。搭载 Coffee Pilot Master(CP Master)的蓝山智能进阶版,在这些场景下的表现,可以用四个关键词概括:听得懂、开得稳、躲得早、敢公开。
“听得懂”,体现在交互上更接近真实司机的思维。驾驶员可以用很自然的话直接开口,比如“帮我起步”“离旁边大车远一点”,系统会立刻接手,并且只认驾驶员的声音,不会被副驾乘客误触。这种“只听车主”的设计,看似小细节,实则直接降低了误操作风险。
“开得稳”,是整套系统的风格基调。很多人吐槽有些车的智驾“神经质”:突然一脚急刹、忽快忽慢,坐久了比人开还累。保定直播里有两个典型场景:一是复杂施工路段,前方车道被围挡收窄;二是突然有大型扫地车横穿。CP Master 的处理逻辑很统一:提前减速、柔和制动,没有那种让乘客一头往前栽的急刹。这种“像老司机,而不是像新手”的风格,是靠大量真实路况数据把模型调出来的。
“躲得早”,则是长城VLA最有特色的点:防御性驾驶。当系统预判到前方风险增大,比如前车突然不打灯变道加塞,界面会切换成紫色,自动进入防御模式:适度拉开车距、避免激进变道。长城给这套逻辑起了个很形象的解释——让AI学会害怕。老司机开车稳,往往不是技术多高,而是对风险的敬畏感更强,“多留一分余地”,事故概率就少一大截。
“敢公开”,体现在推理全流程的可视化。以往很多端到端智驾系统是标准的“黑盒”:车自己转向、加减速,驾驶员只能被动接受,完全不知道它在想什么。VLA 上车后,长城第一次把 CoT(思维链)卡片流直接放在中控屏上:系统看到了什么(感知)、觉得这意味着什么(理解)、打算怎么做(动作规划),都能用简明的文字和图示展示出来。对普通用户来说,这相当于给AI装上了“字幕”:知道它在想什么,自然更敢把权力交给它。
有意思的是,这些“看起来很丝滑”的表现,并不是一夜之间拍脑袋做出来的,而是长城在智驾路线选择上几次关键转弯的结果。
公开资料显示,长城在主动安全和辅助驾驶上的研发,最早可以追溯到十多年前。2021年上高速NOH,2022~2023年坚定放弃高精地图,转向无图城市NOA,这些都给后续大模型落地打下了基础。2023年4月,Coffee Pilot Ultra 实现了城市+高速“车位到车位”的覆盖,到目前累计护航里程已经超过2.4亿公里,用户功能使用渗透率接近97%。这组数字很关键:没有足够多、足够复杂的真实数据,大模型只是PPT上的概念,很难上车。
真正触发长城从“端到端”走向“VLA”的,是 2023 年谷歌 DeepMind 发布的那篇《RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control》。论文第一次把“VLA(Vision-Language-Action)视觉-语言-动作模型”作为一个完整体系提出来,把大模型从“只会聊天”变成“能看、能理解、还能实际动手干活”的机器人大脑。
从技术定义来看,VLA其实干了三件事:用视觉理解世界、用语言抽象场景、再把这种理解翻译成具体动作。对汽车而言,这就意味着车不只是“看见一辆车”“识别一条线”,而是能理解“这个电动车骑手看起来有点犹豫,可能要突然变道”“这个行人是迈了一半步又退回去的,不会马上冲出来”,然后对应选择更保守的操作。
长城的理解是:智能汽车本质上就是一种“具身智能”,和机器人属于同一类问题,只不过机器人自由度更高、场景更杂乱,反而比车难不少。因此,VLA先在智驾上落地,是一条更现实的路径。
再加上硬件这次也同步升级:蓝山智能进阶版直接上了 NVIDIA DRIVE Thor-U 芯片,整车 27 个传感器,算力相比上一代提升了 176%。从车规 SoC 到大模型推理芯片,再到传感器布局,这一整套为VLA服务的硬件栈,才让“车上实时跑大模型”不再只是宣传语。
值得注意的是,长城给VLA绑上的第一条“安全带”,并不是更炫酷的功能,而是价值观层面的自我设限。比如国外有些品牌很喜欢展示“招手即停”等互动功能,看起来很科幻,但长城内部测试过之后选择不上车,理由很直接:系统无法判断招手的人是不是怀有恶意,贸然靠近可能会带来无法预估的风险。在这种取舍里,可以看出长城把“炫技”压在“安全”后面,而不是为了营销效果一味堆功能。
再看行业争论很热的“VLA vs 世界模型”,长城的态度也偏务实。所谓世界模型,更像是云端的“虚拟训练场”,通过搭建一个可控的、接近真实世界的环境,让AI在里面经历成千上万次事故预演和极端工况;而VLA则是车端的大脑,两者不是非此即彼,而是互相增益的关系:VLA在路上遇到的真实数据会持续喂给世界模型,世界模型里学到的经验再通过训练回灌给VLA。长城的策略是两条路一起走,而不是站队某一个名词。
回到用户视角,这一切最终会落到一个很朴素的问题上:为什么首搭车型是魏牌蓝山智能进阶版?
蓝山对长城的意义已经不只是“又一台SUV”。2023年,Coffee Pilot Ultra、Coffee OS 3等关键智能化能力,都是从蓝山首发起步的;到现在,蓝山家族累计销量突破10万,成了魏牌在 30 万级混动SUV市场里的“压舱石”。对一台主要面向家庭用户的大七座SUV来说,用户对安全和稳定的期待值,是要高于年轻人玩车的那一批产品的。因此,让长城VLA先在蓝山上落地,本质上是一种“反向验证”——如果能把一家老小都拉得稳稳当当,在更宽松的场景里就更不容易出事。
从高速NOH,到无图城市NOA,再到现在的VLA上车,长城用的不是“哪年突然觉醒”的节奏,而是一路铺路、一路升级的方式。站在2026年的节点回看,会发现这套思路有点朴素,却很清晰:技术路线敢激进,功能落地要克制;AI可以越来越聪明,但必须先学会害怕,才配接管更多的驾驶权。
接下来真正值得观察的,是两件事:蓝山智能进阶版的VLA,在普通用户长期使用场景里的“翻车率”到底有多低,以及这种“可视化、会害怕的大模型智驾”,会不会反过来逼着整个行业重新思考:在智驾2.0时代,安全感到底该由谁来定义——参数,还是价值观。
全部评论 (0)