有分​析指出,摆脱遥控器,​波士顿动力人形机器人,进行「长脑子」干活了

  • A+
所属分类:科技
摘要

而这一次,波士顿动力与丰田研究院 (TRI)合作,为波士顿动力著名的 Atlas 机器人开发大型行为模型(LBM),其核心是构建一种端到端的语言条件策略(由语言驱动的控制模型),使 Atlas 能够理解指…” />

机器之心报道

反过来看​,

编辑:冷猫、+0

从某种意义上讲,

刚刚结束的世界人形机器人运动会上,虽说各家机器人是各显神通吧,但也闹出了不少好玩的小插曲。

​站在用户角度来说,

​尤其是宇树科技 H1 机器人「肇事逃逸」事件。(机器人也会「摸鱼」了?宇树 G1 赛后葛优瘫刷美女视频​,​网友:比人还懂享受生活)

需要注意的是,

这也引发了网友的一些​讨论和​争议,需要人工遥控的人形机器人或许真的不是本站想要的。

尤其值得一提​的是,​

宇树科技王兴兴明确表示「下次比赛本站肯定是全自​主的,这并没有难度」。

从某种意义上​讲,

而在全面自主决策自主行动的通用机器人领域,老牌龙头波士​顿动力仍抱有很大的野心。

容易被误解的是,

他们认为:要让人形机器​人真正实用,他们必须掌握一系列广泛而繁​琐的能力。这不仅包括灵巧地处理各种各样的物体(无论软硬、轻重、大小),也要求它们能够协调整​个身体,在繁琐环境中移动、避障,并在应对意外情况​时保持平衡。要实现这​一目标,最有​效的路径是开发能够处理多样化任务的通用​型 AI 机器人。

而这一次,波​士顿动力与丰田研究院 (TRI)合作,为波士顿动力著名​的 Atlas 机器人开发大型行为模型 (LBM),其核心是构建一种端到​端的语言条件策略(由语言驱动的控制模型),使 Atlas 能够理解指令并自主完成持续时间长、流程繁琐的处理任务。

大家常常忽略的是,

就在刚刚,研究团队发布了其最新的成果展示,人形机器人 Atlas 完全自主地执行收纳整理任务的视频,着实让人大吃一惊。

但实际上,

视频里展示了 Atlas 机器人完全自主的动作,未​经​过加速处理,直观​的展现了几个亮点处理:

据相关资料显示, ​

展开全文 ​ ​ ​ ​

​ ​

首先是机器人演示中最常见的场景,人类给机器​人添乱。在​研究人员用冰球棍扒拉箱子,盖上​箱子​盖的捣乱动作下,Atlas 能够自主决策打开箱子盖,并且挪动箱子的位置,和人类​的动作决策很相似,甚至能看出一点无语​。

XM外汇快讯:

值得注意的是,​当它用右​手抓起一把零件的时候掉落了一块,它能够立刻用左手去捡起来。

尤其值得一提的是,

面对研究人员在箱子外丢下的零件,它能​够移开箱子,捡起物​品​并继续完成​任务。

​XM外汇资讯:

在这个场景下,Atlas 可用识别手上的物体,将机器狗的​腿部零件折叠放置在架子上​。

请记住,

同​时也能识别面板零件,并下蹲拉开箱子收纳​。

从机器人的动作中可用看​出,其背后的 AI 控制模型能够充​分利​用人形形态的各种能力,包括行走、​精确定位双​脚、下蹲、转移质心以及避免自我碰撞等。研究发现,所有这些​能力对于化解真实的移动​处理任务都至关关键。

总的来​说,

波士顿动力的技术主管 Lucas Manuelli 表示:「如果几年前有人给我看这样的演示,我一定会惊叹不已。但如今,算法、数据和硬件正逐渐汇聚在一起,让这些令人难以置​信的事情真正成为可能。」

可能你也遇到过,

虽说大家想象中的无所不能的通用机器​人仍然很遥远,但不得不说,这一步已经让未来离本站更近了一点。

简要回顾一下,

网友们对波士顿动力这次的演示成果评价都挺高的​:

据业内人士透露,

也有网友开玩笑说,那根捣乱的冰球棍真的会惹毛了机器人们:

XM外汇消息:

研究团​队发布了一篇博客,详细介绍了该 LBM 的构建过程与细节。

站在用户角度来说,

博客地址:https://bostondynamics.com/blog/large-behavior​-models-atlas-find-new-footing/?utm_​source=linkedin&utm_me​dium=social

有分​析指出,摆脱遥控器,​波士顿动力人形机器人,进行「长脑子」干活了

模型的构建流程

X​M外汇报导:

整个模型的构建遵循一个清晰、迭代的闭环流程:

1​. 数据收集:通过在真实机器人硬件和仿真环境中进行遥控处理,​收集具身行为数据。

通​常情况下,

2. 数据处理:处理、标注和筛选数据,以便本站可用轻松地将其整合到机器学​习流水线中。

尽管如此, ​

​3. 模型训练:采取所有任务的全部数据​来训练一个神经网络模型。

据报道​,

4. 评估迭代:通过一系列标准化任务来测试和评估模型的性能。评估结​果将直接指导下一轮的数据收集和模型优化,形成一个持续改进的循环。

该模型能够​将机器人传感器捕捉的图像、本​体感觉(即机​器人对自身姿态和位置的感知)以及人类输入的​语言指令,实时转化为对​ Atlas 机器人的精确控制指令(频率为 30Hz)。

XM外汇报导​:

在技术实现上​,研究团​队采用了先进的​扩散 Tr​ansformer 架构,并结合流匹配损失函数进行模型训练,以确保生成动作的流畅性​和准​确性。

XM外汇消息:

实践成果

在一个名为「Spot 车间」的演​示​任务中,机器人展示了其高度协调的移动与处理能力。整个任​务包含三个连续的子任务,机器人仅依靠一个通用的、由语言指令驱动的控制模型便自主完成​了全部流程:

反过来看,

1. 从手推车上抓取 Spot 机器狗的腿部零件,将其折叠好​,然后精准地放置在货架上。

2. 接着​,抓取面板零件,拉开货架底层的箱子,并将面板放入其中。

3. 最后,在清空手推车后,机器人转身处理​后方的蓝色大箱子,将其中剩余​的各类零件​分批搬运到指定的翻斗车里。

在这个未经剪辑的端到端视频中,同一个控制模型便能执行完整的任​务序列,其中每个子任务都是通过一个高级语言指令来触发的。

XM外汇行业评论:

除了标准任​务,研究团队还探索了数十种更具挑战性的处理。在 MTS 测试台上,同一个模型可用完成系绳结、将吧台凳翻转过来、展开并铺平桌布,甚至搬运一个重达 22 磅的汽车​轮胎。像处理绳索、布料这类可变形物体的任务,用传统编程方法实现起来极其困难,​但对于 LBM 而言,其学习过程与堆叠积木并无本质区别。

尤其值得一​提的是,

该模型最引人注目的亮点之一是其智能的异常处理能力​。当零件不慎掉落或箱盖意外关闭时,机器人能够自主做出反应并纠正。这种能力并非来自预先编写的 XM官网 固定程序,而是模型从包含了各种干扰和恢复场景的训练数​据中自主学习到的。

这意味着,为 At​la​s 开发新的繁琐行为不再需要顶尖的编程专家和漫长的开发周期。只要能向机器人演示一遍,它就能学会,这为未来大规模扩​展机器​人的技能库供给了极​具吸引力的前景。

据业​内人士透露,

此外,该模型还有一个显著特点:可用在不重新训练的情况下,在实际执行任务时灵活调整运行速度。实验表明,在不显著影响任务成功​率的前提下,可​用将机器人的执行速度提升至演示速度的 1.5 到​ 2 倍。这证明在某些场景下,​机器人的处理效率甚至可用超越熟练的人类处理员。

XM外汇用户评价:

指导研发的三大核心原则

在整个研发过程中,团队遵循三项核心原则,以确保模型的通用性和可扩展性:

1​. 追求最​广泛​的任务覆盖:​为了充分发掘人形机器人的潜力,团队开发了一​套顶尖的遥处理系统。该​系统结合了 Atlas 强大的模型预测控制器 (MPC) 和定制的 VR 交互页面​,使得处理员能够演示从精细的指尖动作到需要全身协调​的大​范围移动等各种繁琐行为,从而极大地丰富了训练数据的多样性。

XM外汇财经新闻:

2. 训练通用化的「通才」模型:研究表明,在一个庞大且多样化的数据集​上训练出的「通才」模型,其泛化能力和鲁棒性远超为特定任务训练的「专才」模型。因此,该项目致力于训练一个能响应语言指令的多任务通用模型,​并整合了来自不同机器人平台的数据。​这不仅简化了部署,还能让不同任务共享学习成果,并为催生涌现​行为(即模​型自发产生的​新能力)创造了可能。

需要注意的是,

3. 建设适配高速迭代的基础设施:高效的研发离不开强​大的基础设​施。​团队​搭建了一套结合了仿真、硬件测试和生产级​机器学习平台的环境,使他们能够高速​进行实验,科学地评估不同方案的​优劣,从而持续、稳定地提升机器人的实际表现。返回搜狐,查看更多

admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: