马斯克的100 Exa-Flops超算背后:特斯拉Dojo用1.2亿元仿真成本,把自动驾驶接管率压到0.07次的芯片战争
去年6月的某个深夜,德州奥斯汀那条2000公里测试环线上,特斯拉的测试车跑完全程只接管了0.14次。工程师看着数据发呆——这意味着FSD V13在统计学意义上比Waymo那套激光雷达方案还稳。更离谱的是训练成本:蔚来花3个月路测烧掉1.2亿,特斯拉的Dojo超算3天就搞定,而且生成的极端场景数量是真实路测的47倍。这事儿传到华尔街,分析师们连夜改估值模型,把特斯拉从“车企”重新归类到“云计算公司”。
Dojo这套系统其实就是把“上帝视角”塞进芯片里。3万颗D1芯片堆出来的1.1 EFLOPs算力,听起来只是个数字游戏,但落到实处就是1亿帧4K视频11小时跑完训练,比英伟达那套快4倍多。马斯克在财报会上那句“一天生成的仿真里程相当于人类开120万年”或许有点夸张,但工程师私下透露的数据更直接——传统方法需要200辆测试车跑11年才能覆盖的长尾场景,Dojo三个月就能模拟出来,而且还能调参数重来。
这套玩法的核心在于把物理世界“压缩”进算法。OpenAI今年4月发的Sora 1.5版本,能生成4K 120帧60秒的视频,关键不是画面多流畅,而是那个“物理一致性损失”——玻璃杯掉地上能碎成47片,每一片的抛物线轨迹都符合真实物理规律。蔚来拿这套工具一天生成50万小时暴雨夜晚的驾驶场景,相当于省下20台激光雷达的采购费用。车企们突然发现,买服务器可能比买传感器更划算。
国内跟进的速度也挺快。蔚来8月发布的NWM世界模型,200万小时真实道路视频喂进去,能提前5秒预测对向大卡车的并线意图,误差控制在10厘米以内。更有意思的是“零样本泛化”这个能力——模型没见过西藏雪天遇到牦牛的场景,靠仿真数据硬是把识别准确率怼到96%。这套东西打包成API对外开放,首日就被17家Robotaxi公司抢光额度,单次调用0.6元,看起来不贵,但架不住调用量大。
硬件这块的变化也挺有意思。寒武纪9月发的“思元”芯片专门针对DiT架构优化,跑Sora生成任务的时间从45分钟压到9分钟,能耗降了六成多。字节跳动直接下单1万颗,塞进剪映做“一键大片”功能,上线一周用户生成了1.2亿条视频。这个量级放在以前,得烧多少张英伟达的卡才能撑得住。
Wayve那套GAIA-1系统玩得更极端——工程师输入“雨夜+逆行+爆胎”三个关键词,30秒生成500段极端场景视频,而且每一帧都带标注。相当于把原本需要真车上路跑11年才能遇到的罕见情况,压缩到3小时的训练时间里。伦敦的保险公司看到数据后,直接给装了这套系统的车队降保费15%。省下来的钱又投回去做训练,越训越便宜,越便宜越敢跑。
这轮技术路线的转向,或许会让整个行业的成本结构重新洗牌。传统车企习惯了堆传感器、跑实车、攒数据的慢工出细活,现在发现对手在虚拟世界里开了倍速挂。当生成一段极端场景视频的成本降到0.03元,而真车路测一公里要烧掉几百块的时候,账怎么算就很明白了。
只是这条路也不是谁都走得通。Dojo那套系统的前期投入据说超过20亿美元,普通创业公司连零头都摸不到。国内能跟进的也就那么几家有钱的大厂,中小玩家大概率只能等着买API调用服务。技术迭代的速度倒是越来越快,去年还在讨论U-Net架构,今年DiT就成了标配,明年会不会又换新玩法,谁也说不准。
全部评论 (0)