特斯拉、川崎人形机器人接连翻车,揭开全球机器人技术老底,而中国正悄悄发力

“特斯拉Optimus陷‘完全自主’质疑”、“川崎重工Kaleido9机器人离不开人工遥控”,近期两款国际人形机器人的一系列技术展示,揭开了当前机器人在技术层面的系统性挑战。而此问题并不止针对于个别机器人产品或个别企业,而是成为了全球机器人行业中的共性难题,更影响着全球机器人产业的技术演进方向和产业化进程。

在这一全球性技术攻关背景下,中国机器人产业在自主化方进行多方努力,并已初见成果,为全球机器人技术的进步提供了新思路。

一、全球机器人行业遇自主化技术鸿沟

12月7日,特斯拉Optimus机器人在迈阿密“Autonomy Visualized”活动中进行瓶装水递送演示时,因动作失控失衡后仰摔倒。引人注意的是,其在摔倒过程中动作与操作员摘下VR头显的动作高度相似,疑似暴露“远程操控”痕迹。这一“穿帮”事件引发外界对其所宣称的“完全由AI自主驱动”的质疑,此事件影响了特斯拉股价创下一周以来3.39%的最大单日跌幅纪录。

特斯拉、川崎人形机器人接连翻车,揭开全球机器人技术老底,而中国正悄悄发力-有驾

而在前不久的12月3日,东京国际机器人展览会上,川崎重工展示的人形机器人Kaleido9流畅完成清扫、搬运等任务,却被证实全程依赖于遥控操作。公司常务松田坦言,当前AI技术尚未成熟,难以实现完全自主控制。

这两起事件共同指向当前人形机器人领域一个根本性瓶颈:在非结构化环境下的完全自主作业能力仍存在显著技术鸿沟。事实上,这也是全球机器人行业技术瓶颈的共性。

特斯拉、川崎人形机器人接连翻车,揭开全球机器人技术老底,而中国正悄悄发力-有驾

当我们以此来审视自家的人形机器人时,会发现中国大多数机器人也难以脱离预设程序或人工干预,实现真正意义上的自主运作。例如,在2025年机器人运动会中,现场90%以上的机器人活动均为遥控操作;社交媒体上大量用户反馈,某国产机器人龙头的人形机器人在斜坡、楼梯等场景中无法完全自主完成动作,需人工辅助调整;酒店、餐厅的服务机器人在导航和避障时仍存在缺陷,需人工干预以避免碰撞或卡顿。

由此可见,中国机器人企业同样需要攻克机器人的自主化难题。

二、中国应对策略:机器人自主化的多维探索

虽说目前的机器人技巧展示为了安全性和宣传功能而使用遥控操作已成为行业共识,但机器人真正的价值验证,必须发生在没有人类干预的真实环境中。只有当机器人能够依靠自身的“大脑”应对突发状况并独立完成任务时,其作为智能体的实用性与可靠性才得以确立。因此,超越遥控演示,推动机器人实现更高层级的决策自主性,是全球机器人技术发展的必然方向。

而中国已意识到此问题并在机器人完全自主化进程中形成了一套系统性的发展模式以求改进。

顶层设计与政策协同:构建制度保障体系

在政策与战略层面,2025年,国家先后发布《"十四五"机器人产业发展规划》《机器人+应用行动实施方案》等重要文件,不仅明确了"感知-认知-决策"一体化的技术路线图,更重要的是建立了从基础研究到产业应用的全链条支持体系。

在地方层面,北京、上海、浙江、重庆、安徽等多地政府出台专项政策,如《北京市机器人产业创新发展行动方案》《浙江省人形机器人产业创新发展实施方案》等,设立创新中心、提供资金支持,共同攻破机器人自主化技术。

自主化技术攻坚突破:瞄准机器人“大脑”

在机器人自主化的核心技术层面,中国产业界正致力于攻克环境理解与智能规划两大瓶颈,这是实现自主化的智力核心。

其一,是多模态融合感知技术。机器人要在动态、非结构化的真实世界中行动,必须像人类一样综合利用视觉、听觉、触觉等多种感官信息,形成对环境的统一、准确的理解。单一模态的感知存在局限,多模态融合是提升环境建模完整性、增强抗干扰能力的关键。

目前,国内机器人企业正积极布局相关技术研发。优必选基于开源的DeepSeek-R1深度推理模型进行二次开发,构建了其多模态推理大模型。该模型的核心是能够同时处理并融合来自摄像头、麦克风、力传感器等多模态数据,使机器人不仅能识别物体的外观与位置,还能结合触觉判断其材质与重量,从而做出更符合物理现实的精准操作决策。

特斯拉、川崎人形机器人接连翻车,揭开全球机器人技术老底,而中国正悄悄发力-有驾

智元机器人推出的世界模型开源平台“Genie Envisioner”则更进一步,其基础组件GE-Base作为一个大规模的指令条件视频扩散模型,能够直接消化多视角的机器人操作视频,学习并预测机器人与环境交互的复杂动态,本质上是在构建一个基于视觉的、能够模拟物理交互结果的“感知-预测”模型,为后续的动作生成提供高质量的时空上下文理解。

特斯拉、川崎人形机器人接连翻车,揭开全球机器人技术老底,而中国正悄悄发力-有驾

智元机器人Genie Envisioner平台架构

其二,是自主决策与规划算法。在准确感知环境的基础上,机器人需要具备自主分解任务、规划动作序列并在执行中动态调整的能力,使机器人能自主应对非预编程的复杂任务,这是迈向更高阶智能的关键。

越疆机器人的AI边缘计算与实时环境建模算法强化了其产品的边缘实时决策能力。通过将轻量化AI模型部署于本地,机器人能够脱离云端,实现毫秒级的现场数据处理与自主决策,并根据环境反馈进行动态调整;若愚科技推出的“若愚·九天”多模态大模型,通过深度融合多模态信息,赋予机器人强大的跨模态推理与场景理解能力。使机器人不仅能“感知”数据,更能在此基础上进行逻辑与关系推理,形成更接近人类思维的任务规划与决策链,从而在复杂的物流、制造等场景中实现自主的任务分解与执行规划。

特斯拉、川崎人形机器人接连翻车,揭开全球机器人技术老底,而中国正悄悄发力-有驾

搭载“若愚·九天”大模型的若愚“揽月”人形机器人

目前,中国在机器人自主化技术方面的成果初显,而未来,这些技术也将会通过开源这一趋势加速产业协同创新创新,共同突破机器人更高阶的自主化技术难题。

产业应用牵引:场景驱动的技术验证机制

技术的最终价值在于解决实际问题,中国庞大的制造业升级需求和丰富的服务市场,为机器人提供了多样化的试验场。

这些机器人在各领域中试验应用,真实环境的复杂性和不确定性不断对其感知、决策与执行能力提出新挑战,产生的海量场景数据又反向驱动算法的优化与升级。这种“场景驱动-技术反馈”的循环,确保了研发方向始终瞄准真实世界的需求,促使自主化能力在解决具体问题的过程中得到扎实锤炼和渐进式提升。

结语

特斯拉Optimus与川崎Kaleido9的“翻车”事件如一面镜子,映照出全球机器人产业在自主化道路上共同面临的挑战。在这一全球性技术攻关过程中,中国机器人产业展现出了一条具有参考价值的的发展路。

中国在机器人自主化道路上的探索,体现出系统整合与务实渐进的思路。通过将技术攻关锚定在实际应用需求上,并在相对完整的产业链条中进行迭代优化。在这一过程中,中国机器人产业界正不断积累真实的工程经验、场景数据与市场认知,逐步构建起可持续的自主创新能力,以此应对全球技术快速迭代的长期挑战。

0

全部评论 (0)

暂无评论