特斯拉或改变Optimus的训练策略,加入视频学习

知情人士透露,特斯拉已经改变了其擎天柱人形机器人的训练策略未来或将主要依靠视频训练,而不是仅依靠动作捕捉和遥控操作。这一人事变动发生在擎天柱项目主管米兰·科瓦奇卸任后不久。知情人士透露,人工智能主管阿肖克·埃卢斯瓦米已接任该项目负责人。特斯拉长期以来一直使用类似的方法来训练其自动驾驶软件这一技术路线转变体现了埃隆·马斯克使用机器视觉+人工智能路线坚持,也反映了该公司对自动驾驶技术的态度。

该汽车制造商内部人士在6月底告诉员工,将更加注重Optimus项目的愿景导向但此前特斯拉正在利用一份陈旧的技术蓝图来训练其人形机器人例如特斯拉此前曾使用动作捕捉服和虚拟现实设备来记录人类操作员的数据并远程操作机器人这引发外界对于其技术前沿性的质疑。如今,这家汽车制造商计划专注于录制工人执行任务的视频,教会机器人如何快速执行诸如拾取物体或折叠T恤之类的操作。据内部人士透露,该公司表示,放弃动作捕捉服和远程操作将使团队能够更快地扩大数据收集规模。

特斯拉或改变Optimus的训练策略,加入视频学习-有驾

新技术路线的可能性

目前消息人士称,尚不清楚特斯拉未来是否会再次优先考虑动作捕捉服和远程操作,或者是否会利用视频数据来巩固之前收集的信息。因为远程操作和动作捕捉是行业内训练机器人的标准做法。例如,领先的机器人公司波士顿动力公司就已利用远程操作技术训练其Atlas机器人。在训练过程中,执行各种任务的工人会穿着动作捕捉服;然后将数据输入机器人。此外,还可以穿着动作捕捉服来远程控制机器人。有业内人士表示,大量的远程操作数据可以让机器人通过与环境进行物理交互来学习,教会机器人将视频数据转化为现实世界的内容可能很困难。

今年5月,特斯拉发布了一段视频,Optimus硬件部门主管Konstantinos LaskarisLinkedIn帖子中已经承认了这一新策略的应用潜力这听起来难以置信,但我们的机器人确实直接从人类视频中学习新任务!Laskaris当时写道马斯克还在五月份表示,该机器人最终将能够通过观看YouTube视频来学习如何执行任务。

据知情人士透露,在过渡期间,特斯拉曾短暂暂停了Optimus团队的招聘过去一年中,有超过50人在不同时期担任过该职位。截至8月底,特斯拉的招聘页面上列出了最新50多个与Optimus相关的职位但排除了动作捕捉数据收集员的招聘项目。去年,该公司招聘数据收集员这些职位负责执行和记录基本的家务招聘信息显示,这些人员需要长时间穿着动作捕捉服和佩戴虚拟现实耳机这项工作可能需要通过穿着动作捕捉服执行简单任务来收集数据,这些数据可以被记录下来并由数据注释者进行分析,以训练人工智能系统,以及直接远程操作人形机器人。视频片段显示,一名操作员身穿动作捕捉服,戴着触觉手套和 VR 耳机拾取物体,而仿真环境下的特斯拉擎天柱机器人则执行相同的动作。

特斯拉或改变Optimus的训练策略,加入视频学习-有驾

截至6月底,该项目仍在进行远程操作Optimus,并通过动作捕捉服对其进行训练。内部人士表示,自培训轮班以来,工人们一直专注于使用内部制造的五台摄像头记录自己的动作。这些摄像头安装在工人佩戴的头盔和沉重的背包上摄像头指向各个方向,为人工智能模型提供数据,使其能够精确地适应周围环境。有专家介绍,不同的摄像角度可能让特斯拉的工程师借此能够收集更多细微的细节,比如关节和手指的位置,并将机器人正确地放置在空间中。

消息人士称,工作人员花费了大量时间排除动作捕捉服和Optimus的问题,这限制了团队能够收集的数据量例如工厂动作的训练,可能需要数十万小时到数百万小时的数据才能基本实现,这意味着需要收集的数据量成本达到五亿美元,而且不确定能否成功。因此他们正在试图寻找新的方法,目前使用的视频可能是他们之前通过远程操作收集的数据的一种补充和扩列的举措,也可能成为未来Optimus人形机器人训练的常态

合成数据或成为新方法

谢菲尔德大学机器人专家乔纳森·艾特肯(Jonathan Aitken)接受外媒采访时表示,特斯拉可能在寻找一个更加通用的方法,来训练擎天柱适用于各种任务动作因为随着数据规模和任务规模提升,动作所消耗的时长,将会成为大多人形机器人公司无法接受的问题。工人们会收到关于如何执行培训任务的具体指导,尤其是在手部动作方面,并确保动作尽可能像人类一样。一位知情人士表示,他们可能要花几个月的时间来完成同一项简单的任务。

他补充说,这也使得特斯拉或许未来会采用与Physical Intelligence类似的策略该公司为机器人提供大量演示数据,以便它们能够学习可转移的技能并灵活应用,而不仅仅是记住如何执行单一任务。

马斯克在一月份的财报电话会议上承认这一问题擎天柱人形机器人的训练需求最终可能至少是汽车所需训练需求的10倍。这意味着对于特斯拉来说,训练Optimus将是一个比开发自动驾驶汽车更艰巨的项目。

方法与特斯拉自动驾驶软件的训练流程相一致。虽然其他自动驾驶汽车公司大多使用激光雷达和雷达传感器来训练他们的自动驾驶软件,但特斯拉主要依靠机器视觉从数百万车主收集的数据中快速训练。此前特斯拉就展示了他们利用亚洲公开的街道视频训练了其人工智能系统。

特斯拉或改变Optimus的训练策略,加入视频学习-有驾

但也有专家指出,因为人形机器人的训练难度无疑更大,因为行走只是其中一项任务,人形机器人还需要通过视频学习理解这些事情,然后掌握完成任务的技能,有些东西可以通过观看来学习,而有些东西则需要通过实际练习,无论是在模拟器中还是在现实世界中。

如果特斯拉只是使用视频数据,而舍弃直接获得真实数据,很难弥补虚拟到现实的鸿沟。虽然折叠T恤和捡拾物品这类交互成本低的任务或许能通过视频学习完成,但是更多真实任务却很难完美达成。这使得波士顿动力以及部分中国公司采用的视频数据与真实数据的混合应用策略或许依然是更远的未来。

0

全部评论 (0)

暂无评论

热门推荐

宝石蓝熊猫驾临 宾利诠释终极稀缺
匆匆爱发文
副车新趋势,雷达地平线如何改变生活?
小兴体育说
00:21
徐州远翔机车科技有限公司,是一家拥有国家工信部电摩一级生产资质企业,公司成立于2006年,经过十几年的深耕细作,现公司占地200亩,单体厂房10万平方,总面积高达12万平方的超级工厂。 公司主要生产适用于人民交通骑乘,运载货物,特种需求等功能的新能源电动摩托车产品,能充分满足不同消费群体的适用需求。 公司拥有国内外先进的阴极电泳喷涂流水线2条,废石轮转环保设备2套,全自动焊接机器人流水线30余条,焊接机器人总数高达200余台,总装流水线4条,研发设备100余套,全自动大型冲压设备100余套,检测设备200余套。形成四大工艺齐全,产品从设计,研发,生产,检测完全自主化完成,产品自动化程度高达70%,具备年产30万台电动三轮车摩托车生产能力。 在产品研发方面,经过多年的探索与实践,公司培养了一支高效率、高素质的研发队伍,建立了功能完善、具备一流水平的技术中心,包括摩托车研发设计检测中心,具备整车一体化、动力系统匹配、电器系统匹配等设计计算和仿真分析能力;另建有油泥模型室以及车架性能及耐疲劳测试、动力系统、蓄电池性能的耐久性测试等主要零部件实验室;公司形成了能充分满足中国用户出行需求、创造最佳客户体验的整车研发能力。 在质
江苏珠峰机电科技公司
最便宜纯电中大型MPV,媲美埃尔法,仅售9.98万,还要啥自行车?
隔壁老王车说
01:31
怠速抖1分斜最简单三个原因
汽车头rap
长安启源全新轿车命名A06!轴距超2.9米,预计售价15万左右
车车万事通
大众放大招!全新途昂PRO实车曝光+换装第五代EA888发动机,汉兰达该慌了!
汽车达人俱乐部
挑选充电桩什么牌子好?特顾森充电桩值不值得入手?
科技小姨
长安转型新路,能否迎来真正的爆款?
田七
加载中...