蔚来NWM 2.0推送28天后,46万车主用1.2亿公里数据,揭开全闭环强化学习系统三大技术悖论与用户博弈真相
你们说蔚来这次玩的到底是技术革命还是用户实验?
我开程序的朋友老张,上个月刚把他那台2020款ES6升级到NWM 2.0。头一个礼拜他天天在群里骂,说车速莫名其妙降到60,高速上被后车狂闪灯。第二个礼拜他不吭声了。第三个礼拜突然发了条消息:“我好像明白蔚来在干什么了。”
这事儿得从1月29号说起。蔚来那天推了个OTA,覆盖46万辆车,从2018年的ES8到去年的ET5T全都能用。听着挺平常,但内核完全变了——这是中国第一个扔掉专家标注数据的智能驾驶系统。
什么意思?以前的智驾系统都是工程师告诉车:“遇到这种情况你该这么开。”一条一条规则写进去,碰到没见过的场景就傻眼。NWM 2.0不一样,它拿1.2亿公里的人类驾驶数据喂出来一个模型,让车自己学会开。变道成功了给奖励,别的车急刹了扣分,就像训练小孩,摔多了自然就知道哪里有坑。
听着很牛对吧?问题就出在这儿。
老张第一个礼拜遇到的问题不是个例。限速80的路段,车开到65就不动了。前面空荡荡的,系统就是不肯提速。论坛里有人气得说:“我买的是车还是老年代步车?”蔚来的回应很直接:数据不够。1.2亿公里听着多,实际上只是特斯拉FSD的八分之一。模型没见过足够多的路况,就只能选最稳的策略——宁可慢,不能出事。
这就尴尬了。你说它是技术不行吧,人家复杂路口的通行效率提升了37%,无效变道少了62%,轨迹平滑度从1.2降到0.4,数据摆在那儿。你说它行吧,高速上开65确实让人抓狂。
更绝的是跟车距离。系统默认保持2.5秒时距,城里开车基本等于给别人预留加塞位。有个杭州的车主统计过,15公里的路被加塞23次,气得想砸方向盘。蔚来说这是为了安全,可用户要的是效率。
矛盾就在这儿:你把控制权交给模型,那模型的决策逻辑用户就得接受。可用户凭什么接受?我花几十万买的车,连车速都不能自己定?
李斌倒是有句话说得实在:“我们挖了最深的坑,现在要盖最高的楼。”意思是前期保守,等数据积累够了自然就激进了。可问题是这个“够”到底是多少?蔚来说还差3年才能达到5亿公里的临界点,这3年用户就得陪着熬?
换个角度看,蔚来这次确实干了件别人不敢干的事。
它把世界模型和强化学习结合起来了。世界模型负责预测——前方车3秒后会怎么开;强化学习负责决策——我该怎么应对。两个东西一配合,抢道变道成功率从78%飙到91%,而且95%的变道不会让后车急刹。听着简单,实际上每次决策系统要计算12项参数,生成5种可能的轨迹,然后选最优解。这套东西对算力要求高到什么程度?蔚来批了10万张A100显卡的预算,单次训练烧2000多万。
这钱不是白花的。他们搞了个领航换电功能,全国2000多个换电站,车自己能开进去换完再出来。泊车误差控制在5厘米以内,比人工操作快41%。关键是系统会算账,根据你的电量、换电站排队情况、沿途路况给你规划最优路线。有个女车主说:“以前我得自己算去哪个站不用排队,现在系统连这个都帮我想好了。”
这事儿能做成,靠的就是数据量。蔚来现在一天能收集1500万公里的驾驶数据,这个速度再过3年就能达到临界点。到那时候模型就不用工程师教了,它自己能发现规则。这是华为和小鹏都还没做到的事。
但这里头有个更深的问题:技术优先级到底怎么定?
系统觉得安全第一,用户觉得效率第一。遇到施工路段,系统会降到40开双闪,后面恢复限速又特别慢,得你自己踩油门。用户说这是智障,工程师说这是谨慎。谁对?都对,也都不对。
蔚来其实也知道这个矛盾解不开。所以2月底他们要推新版本,加个“智能限速调节”开关,让用户自己选车速在限速的60%到100%之间浮动。同时云端继续训练模型,让它学会在安全场景下自动提速到95%限速。两条腿走路,既给用户掌控感,又不放弃模型学习。
这个策略聪明。它承认了一个事实:全自动驾驶不可能一步到位,过渡期用户和系统得互相妥协。你给系统时间让它学,系统给你开关让你兜底。
老张现在就是这个状态。他说第三个礼拜车明显变聪明了,幽灵刹车从一开始的一周好几次降到现在基本没有。系统在学,他自己也在学怎么跟系统相处。“反正也退不了货,不如陪它长大。”他这么说。
这话听着像笑话,但可能就是现实。
蔚来这次推NWM 2.0,本质上是把用户变成了测试员。46万辆车,每辆车每天跑几十公里,数据源源不断地喂给模型。用户在骂的同时,也在帮蔚来训练这套系统。等数据量突破临界点,第一批受益的还是这些人。
所以李斌说“结硬寨,打呆仗”。这话翻译过来就是:我不追求短期炫技,我要的是长期碾压。华为ADS靠规则库堆场景,规则冲突了决策就慢0.3秒;小鹏VLA靠提升传感器精度,算力需求涨了40%。蔚来的路线是用世界模型挖数据金矿,前期慢,后期稳。
可这个后期到底有多后?3年够不够?用户等不等得起?市场给不给这个时间?
没人知道答案。
现在只能确定一件事:蔚来把赌注压在了数据和时间上。它相信只要数据量够大,模型就能自己进化出最优解。这个逻辑没问题,OpenAI的Sora、Meta的JEPA都是这么玩的。问题是车不是软件,它跑在路上,出了事可是要命的。
所以这次OTA其实是个赌局。蔚来赌用户愿意陪它熬这3年,赌数据能按计划积累,赌市场不会因为短期体验差就把它淘汰。
老张最后说了句话:“蔚来要是成了,这套系统就是降维打击。要是没成,那就是全世界最贵的测试版。”
你们觉得它能成吗?
全部评论 (0)