你有没有想过,为什么马斯克总在强调算力不够这件事?11月8日他在社交平台上和网友聊到特斯拉自动驾驶的技术挑战时,说出了一个细节:车载计算机每秒要处理1.5GB的视频流,却只能输出大约2KB的控制指令,还不能出任何错误。听起来像在开玩笑,但这句话其实点到了纯视觉自动驾驶的命门。
我查了下资料,这个问题背后其实是自动驾驶系统的核心逻辑。特斯拉的纯视觉方案放弃了雷达和超声波,全靠摄像头和神经网络判断环境。车上八个摄像头每秒会生成海量视频数据,系统必须在极短时间内从画面里识别出行人、路标、障碍物、红绿灯,然后在几毫秒内决定是刹车、转向还是继续前进。问题是,车载芯片的算力有限,空间、功耗、散热都受约束,数据又巨大,所以每一步都要压缩。马斯克说很难避免过度压缩,其实就是在讲:如果神经网络把视频压得太狠,丢掉了关键细节,比如那是一只狗还是塑料袋,决策就会出错。
目前特斯拉汽车使用的是AI4芯片,也叫HW4,理论算力大概在250TOPS左右,已经不算弱(数据来源:Not a Tesla App 2024年5月报道)。但特斯拉计划在2027年推出的AI5芯片,算力预计可达2000到2500TOPS,是现在的几十倍(数据来源:NextBigFuture 2025年6月报道)。这意味着未来的自动驾驶系统将能同时处理更多路况、更复杂的模型、更少的延迟。换句话说,AI5的出现也许能部分解锁纯视觉自动驾驶的潜能。
我想象了一下那台芯片在工作时的样子:车子行驶在夜路上,前方灯光反射在积水上,摄像头捕捉到复杂的光影。神经网络在瞬间判断出这是反光不是障碍,而推理芯片要在几毫秒里完成这一切。它得把几十帧视频、几百兆信息,压缩成一句话式的控制指令。想清楚这点你就知道,马斯克说的不是夸张,而是现实。特斯拉选择纯视觉路线,相当于走了条算力与算法的极限之路。没有激光雷达兜底,系统每一次判断都必须靠自己看懂世界。
这几年我一直关注特斯拉在AI芯片上的布局。它最早从英伟达的Drive PX平台转向自研芯片,再到AI3、AI4,甚至建立了Dojo超级计算机来训练模型(数据来源:IEEE Spectrum 2024年2月报道)。但马斯克现在的重点显然转向了推理而非训练。训练是把AI教会看世界,推理才是让它在车上活用。AI5的设计思路,就是让车内芯片能像人脑那样在复杂环境里实时反应,而不是依赖云端。这意味着特斯拉的方向是彻底本地化决策——车不靠远程控制,所有判断都在车内完成。
问题在于,即便AI5算力再强,自动驾驶依然不是单纯的算力问题。算法的鲁棒性、数据集的多样性、监管标准、安全验证,这些都需要同步解决。就算马斯克能在2027年让AI5上车,也不代表那时车子就能完全放开双手。美国加州到现在仍对全自动驾驶许可卡得很严,中国也在逐步试点自动驾驶出租车,但都在特定区域内运行。算力提升能解决延迟,却解不了信任。
我倒觉得,马斯克这次算力论的背后,更像是在给特斯拉的技术节奏定调:AI4是实用阶段,AI5是跨越阶段。纯视觉方案能不能最终跑通,不在于理论,而在于能否持续积累足够多的真实驾驶数据。现在特斯拉全球已有超过四百万辆车在上传行驶数据(数据来源:特斯拉官方2024年投资者报告),这些都是AI模型的训练素材。马斯克的底气,也许就来自这里——哪怕算法偶尔出错,庞大的数据池能让系统更快纠正。
回到那句1.5GB压成2KB的比喻,我越想越觉得它像是在说人类大脑。我们每秒接收的视觉信息远超想象,但最后做决定的只是几毫秒的神经冲动。区别在于,人类有直觉,机器没有。AI必须靠算力去弥补直觉的缺位。马斯克也许不是在炫技,而是在提醒:真正的难题不是算法,而是让一块硅片在极限时间里理解世界。
当一辆车能在几毫秒内完成你整个思考过程时,它还是工具吗?你还敢在这种车里边看剧边打哈欠吗?
全部评论 (0)