理想L6是自动驾驶(L3及以上)

李想于自己微博中透露,此乃突破性的E2E+VLM技术的「自动驾驶」。

在聊这个之前,先讲讲理想当下的智驾体系。

目前,理想智驾分为AD Pro和AD Max,前者为基础版本,后者属于高阶版本。

AD Pro引入了轻舟智航作为智驾供应商,而理想自身的精力则着重放在AD Max上。

2023年12月,理想向用户推送了AD Max 3.0。

3.0将感知、规控进行了模型化,同时引入BEV大模型和Occupancy占用网络,使得理想达成了无图城市NOA。

理想L6是自动驾驶(L3及以上)-有驾

尽管从整体架构层面来看,AD Max 3.0已偏向端到端,但尚未实现完全的端到端。

而此次演示的智驾版本才算是真正意义上的端到端智驾。

02最快年底推送L3自动驾驶

「我们觉得最早在今年年底,最晚在明年上半年,真正的L3(有监督的自动驾驶),就能批量交付给用户。」

需注意,这里说的是自动驾驶(L3及以上),并非辅助驾驶(L0-L2.9)。

刚刚提到的「E2E+VLM技术」便是理想实现自动驾驶的底气所在。

理想为自动驾驶系统构建了两个系统:快系统(System 1)和慢系统(System 2)。

理想L6是自动驾驶(L3及以上)-有驾

这个系统概念源自丹尼尔·卡尼曼(Daniel Kahneman)的著作《思考,快与慢》:

系统一(快速思考):这是一个快速、直觉、自动的思考系统。它几乎无需我们有意识地努力,就能迅速对信息做出反应。系统一负责处理日常任务,比如识别熟悉的面孔、进行简单决策和习惯行为。它依赖于启发式和心理定势,可能速度快但并不总是准确。系统一在很多情形下能良好运作,但在复杂或需要深入分析的情况下可能会出错。

系统二(慢速思考):这是一个缓慢、逻辑、需努力的思考系统。它需要我们集中注意力和精力来进行复杂计算、深入思考、解决难题或评估系统一的直觉反应。系统二在处理需要逻辑推理、风险评估和长期规划的任务时更为可靠,但它也更容易疲劳和出错。

在理想看来,端到端智驾依靠数据驱动,然而现实生活中未知场景/长尾场景数不胜数,单靠数据驱动无法彻底解决智驾遇到的问题,很多场景需要具备对真实事件真正的理解和变通能力。

于是,对于L3以及L4自动驾驶的实现,理想引入了新方式:知识驱动。

进而就有了这两个快慢系统。

System 1(快系统):通过端对端,实现快速信息输入和响应。

System 2(慢系统):借助VLM这样的认知模型,对周遭环境展开分析推理并进行逻辑思考。

在后续决策环节,两种决策结果能够进行拟合比对,从而给出最优规控解。

理想L6是自动驾驶(L3及以上)-有驾

这反映到车端就是智驾能更加拟人,误触发情况也会更少。比如以后在开车途中遇到前方路牌上的车辆广告,系统会更精准地识别,不会误触发AEB,再比如在复杂路口,可以做出更拟人的避让通行等。

今年升级后的理想AD Max3.0换上了两颗Orin X芯片,算力更强,所以一颗用于跑端到端,另外一颗则用于跑压缩后的VLM模型,如此刚好合适。

此外,理想还有一个云端世界模型,用于训练这两个快慢系统,进而形成完整数据闭环。

在过去几年,理想也构建了庞大的智驾训练集群以实现对智驾模型的训练和快速迭代(算力1400 PFLOPS)。

一个参考数据:小鹏扶摇智算中心算力600PFLOPS;毫末智行智算中心雪湖·绿洲(MANA OASIS)算力为670PFLOPS;百度给极越留的智驾算力在1.8-2.2EFLOPS;华为智驾云端训练算力3.5EFLOPS(真可谓遥遥领先)。

理想L6是自动驾驶(L3及以上)-有驾

今年三季度,理想将正式在全国推送无图NOA,同时也会向测试用户推送搭载E2E+VLM技术的「自动驾驶」。

李想如此说道:「随着这套技术的演进,算力的增强,模型的加大,我认为无监督的L4自动驾驶也会在至少三年内实现。」

0

全部评论 (0)

暂无评论