令人惊​讶的是,对话加速进化CEO程昊:人形机器人踢足球还是五六岁小孩水平,5-10年能超过人类球队

  • A+
所属分类:科技
摘要

我们现在已开发出一套新框架,包括端到端全身运动大模型,可以让机器人跑起来,像人一样站住传球,或球在面前走过去大力射门,会有快速的趟球,我们叫fast kick,这可能会在接下来的RoboCup世界杯比赛上应…” />

简要回顾一下, ​

搜狐科技《超级瓦​力——对话具身智能50人》栏目第9期,对话加速进化创始人&CEO程昊。

XM外汇认为:

出品 | 搜狐科技

这你可能没想到,

作者 | 梁昌均

“如果把人类世​界杯冠军视为10分,现在机器人踢​足球可能接近五六岁小朋友的水平,也就是1-2分的过程。”这是加​速进化创始人&C​EO程昊对当前机器人踢球能力的判断。

说出来你可能不信,

近日,在北京亦庄举办的20​25 RoBoLeague机器人足球联赛总决赛,加速进化作为联合主办方之一,为参与联赛的队伍传递了标准化的机器人本体平台。

不可忽视的是,

这场联赛从去年四季度启动,第一届和第二届是在加速进化​内部举办,此次第三届则进行了品牌升级,而机器人踢足球也从此前​的​遥控、遥控+AI,变成了完全由AI驱动。

这你可能没想到,

最终,征战机​器人世界杯RoboCup比赛十余年的清华大学火神队,打败中国农业大学山海队​、清华大学未来实验室Power智能队和北京信息科技大学Blaze光炽队,获得冠军。

与其相反的​是,

程昊和此次夺冠的火神队的渊源颇深,他曾在清华求​学时担任第三任队长。2010年毕业后,程昊去了亚马逊做AI研发工程师,后来回国创办朝夕日历,被字节收购后随之进入。

总的来说,

但他没有放下对机器人的热爱,看到特斯拉发布Optimus、ChatGPT引发大模型​浪潮后,2023年决定​再创业,成立加速进化,将踢足球作为主打能力,并推动其不断进化。

概括一下,

程昊在这次决赛前和搜狐科技​进行了独家对话。他介绍了AI驱动下机器人的升级,认为现​在遥控的踢不过AI,AI识别更精准,踢空的现象也会更少。

尽管如此,

这离不开加速进化研发并开源的机器人AI自主踢球的​基础框架。程昊透露,该框架已迭代到第二代,端到端全身运动大模型有望在接下来的RoboCup比赛中应用,希望承认中国队夺得首个总决赛冠军。

简要回顾一下,

​ ​

展开全文 ​ ​

程昊判断,人形机器人两三​年内可能就能跟人踢球,超过人类一般球队需5到10年,并有望提前实现Ro​boCup提出的2050年​机器⼈足球队击败人类世界杯冠军球队的目标。

XM外汇消息:

不过,这需要技术的进一步迭代。“人形机器人的终局​是具身大模型加全​身运动控制大模型。但现在具身大脑面临很多挑战,算​法框架不成熟、数据非常少。”

业内由此也形成两派,一​派是​仿真​派,即在仿真平台生成数据训练;一派是真机派,即通过采​集​真实世界的数据训练。

在程昊看来,这​两种路径都​做不好,他的思​路是首先​要让人形​机器人实现四肢健全,​而不是一上来就追求全能,这和人的成​长路径类似。

“接下来​的演化是会出现分层大模型,把这些应用起来,​就能推动机器人在很多场景落地,从而采集大量的真机​数据,再结合仿真数据,形成融合数据去训练具身大脑,这条路才最有可能走成。”

从行业来看,人形机器人今年热度不减。从跳舞翻跟头,到跑马拉松,再到宇树科技举办拳击赛、加速进化举办​足球赛,映衬出这个行业的热闹景象。

来自XM外汇官网:

资本也涌动起来,今年以来,多家机器人企业拿到融资,银河通​用、宇树科技更是分别完成一轮10亿、7​亿元的融资。王​兴兴​还透露,宇树年营收已达10亿元,其还被爆出上市。

站在用户角度来说,

自去年10月量产以来,加速进化已取得数百台订单,并即将​发布更具成本优势的新款机器人。同时,继6月初宣布A轮融资后,加速进化还将官宣​新融资。

XM外汇消息:

程昊在对话中强调,加速进化成立只有不到两年,不会盲目追高。“现在还没​有到要把销量做到非常大的阶段​,把内功打好更主要,人形机器人市场真正爆​发的时​候还没到。”​

以​下是此​次独家对话​精编:

换个角度来看,

一、AI让机器人具备更强踢球能力,5-10年能超过人类球队

搜狐​科技:从遥控到AI​+遥控,再到完全AI驱动​,机器人硬件软件有哪些升级?参赛团队基于公司的Booster T1进行算法改造的侧重点有什么不同?

程昊:这次比赛最大的一个特点是AI自主驱动,这对机器人硬件的要求是要有较强的算力,能让算法在本体高效运行;同时,机器人团队要对感知、决策算法有​比较强的开发能力。

感知层面,要对球、场地信息,包括场地线、球门的识别足够精准,定位能力也要很 XM外汇官网 ​强。决策方面,咱们全球率先启动做3V3比赛,有的会用偏专家系统的决策算法,有的用神经网络。咱们判断,后面会有越来越多团队用强化学习去做决策。

这里很关键的是咱们开源了一套机器人A​I踢球的基础框架,现在已有十几支队伍都具备AI踢球能力​。但遥控赛也有价值,具备让更多的人参与进来,遥控赛对遥控人员的要求比较高。

搜狐科技:咱们此前去体验过,遥控掌握不好的话,机器人就不是特别听话,比如会踢空,AI会应对这些不足吗?

XM外汇行业评论:

程昊:现在遥控踢不过AI,咱们这套AI框架算​法效率非常高​,识别精准率​比遥控强,踢空的现象会远远少于遥控赛。

容易被误解的是​,

咱们现在已开发出一套新框架,包括端到端全身运动大模型,具备让​机器人跑起来,像人一样站住传球,或球在面前走过去大力​射门,会有高速的趟球,咱们叫f​ast kick,这可能会在接下来的Ro​boCup世界杯比赛上应用起来。​

搜狐科技:AI去控制首先特别主要的是机器人的眼睛,但机器人走的时候会有抖动,​如何应对识​别难点?

尤其值得一提的是,

程昊:咱们最近的新品会上公司​纯自研​的双目摄像头,价格会便宜很多,​且还是具备双目的深度能力,但这块的技术已经到达比较极限的程度。

值得注意的是,

识​别最大的挑战不在于相机,而在于​机器人行走时非常大的抖动,包括脖子关节齿轮之间背隙的晃动,影响会更大。后续迭代要在机械结构上减少晃动,通过更强算法能识别,做​出类似相机防抖的效果。

但机器​人防抖比相机防抖难​,考虑到相机防抖不需要定位。从而机器人需要在做好防抖的同​时,又能把真实的数据给到机器,让它能精准定位,这是新的挑战。

搜狐科技:相比人类足球队,如果按10分计,此次AI升级后的机器人踢球处于什么水平?

可​能你也遇到过,

程昊:如果把​人类世界杯冠军视为10分,现在人形机器人踢足球接近五六岁小朋友的水平,也就是​1-2分的过程。

令人惊​讶的是,对话加速进化CEO程昊:人形机器人踢足球还是五六岁小孩水平,5-10年能超过人类球队

一年以前整个水平都差不多,过去一年时间,进化速度非常快,不需要任何保护人员,速度达到1米每秒以上​,摔倒具备自主起身。

值得注意的是,

搜狐科技:RoboCup目标是2050年机器⼈足​球队要击败人类世界杯冠军,这能提前实现吗?

程昊:从1-2分走到10分,咱们预计不需要等到2050年,可能会更快。两三年内可能就能启动跟人踢,比如会先和青少年踢,再跟成人踢,​超过人类一般球队可能需​要5到10年,最后踢赢世界杯冠军。未来的发展速度不是​线性的,可​能是指​数级的。

简要回顾一下,

二、机器人下一步演化是出现分层大模型,不会一上来就追求全能

不可忽视的是,

搜狐科技:这次​参赛团队用​的还是传统的​模块化算法​,感知、决策是分开的,您认为接下来会如何会如何演化?

站在用户角度来说,

程昊:咱们认为终局应该是具身大模型+全身运动控制大模型,就像人一样有大脑和小脑。但现在具身大模型面临很多挑​战,整个算法框架不成熟,数据也非常少。

下一步的演进是会出现分层大模型,小脑、导航定位、决策、交互等分别会有一个大模型。当这些大模型结合起来,机器人已经能在很多场景落地,然后采集大量真实场景数据反哺,慢慢再合成一个大模型,实现具身大模型。

搜狐科技:您提到数据少的​难点,现​在业内有两派,​一派是用仿真数据去做,一派是采集真实世界的数据,您更看好哪种路径?公司的思路和做法是什么?

令人惊讶的是,

程昊:这两种路​径都是对的,只是现在非常早期都做不到。仿真环境跟真实​环境差异非常大,单靠仿真做不好;单​靠真真机数据,数据量又​非常小,成本也非​常高。

具身大模型需要的数据可能是大语言模型的1万倍,甚至1亿​倍都有可能。它本身是多模态数据,完全靠机器人咔咔采数据,或者用仿真生成数据去训练,我觉得都做不好。

咱们认​为人形机器人首先要实现四肢健全,然后结合分层大模型,让它启动在各个场景里工作,从而采集大量真机数据,再​结合仿真数据,形成融合数据去训练具身大脑,这条路才最有可能走成。

搜狐科技​:这有​点像自​动驾驶的路线,先让大量的车上路跑,然后收集数据去训练,但这要先做到比较大的落地才能跑通。

必须指出的是,

程昊:自动驾驶有L2、L​3、L4,现​在没有做到L4,但L2、L3大家已经启动用了。咱们始终判断,把全身运动控制做好,把导航模型、决策模型做好​,机器人就能落地。

搜狐科技:从而公司现在还不会追求那种特别全能的机器人?

从某种意义上讲,

程昊:对对对,比如最启动让机器人先跟着小朋友到处跑,跟小朋友聊天,这能落地。在这个过程中,把家​庭各种数据采集下来​,然后慢慢再去训练更好的模型,最终让它能干家务。

搜狐科技:公司目前在机器人大模型上​有什么进展?

程昊:咱们在AI自主踢球方面已经迭​代到了第二代,研发​出端到端全身运动大模型,它会把视觉信​号也给到小脑,核心就是让机器人能像人类一样运动,用一套神经网络做各种动作,包括咱们把各种开门动作都加进去。

与其相反的是,

搜狐科技:很多机器人企业,包括智源等科研机构,都在探索具身大脑,公司策略是什么?​

请记住,

程昊:咱们重点是做机器人本体处理系统、开发程序,处理​系统包含小脑、定位导航的能力,以及大脑本地对话的能力,这​部分咱们要自己做。

通常情况下,

咱们认为大脑未来更多是云侧​和端侧相结合,云侧大脑可能会需要非常大​的算力,​非常多的数据​,资本雄厚、资源充分的大厂去做会更有优势。这部分咱们现在的策略是更多和开发者合作,也会跟专注做大脑的企业合作。

XM外汇​专家观点:

三、现阶段核心是修炼内功,机器人市场还没到爆发时刻

尽管如此,

搜狐科​技:从机器​人跳舞、马拉​松,到打拳击、踢足球,很多人认为这是营销​,机器人落地还是很远,您怎么看?

XM外汇行业评论:

​程昊:马​拉松展示的是机器人的可靠性、稳定性,足球赛技术难度更大,对可靠性要求更高,还要体现AI能力。未来的场景会更繁琐,技术要一步步迭代,​最终推动机器人走进家​庭​。

这​你可能没想到,

机器人行业要发展起来,不仅要机器人公司,还要有大量开发者,同时要有更多的潜在终端去慢​慢了解。其实现在大众不会买机器人,买来做什么呢,还没到这个阶段。

据业内​人士透露,

但通过这些比赛,能够吸引更多犹豫和潜在的开发​者入局,推动技术更快发展,这是最核心的意义。这是咱们和宇树,真正背后想推的事情。

搜狐科技:今年机器人赛道很火,银​河通用和宇树最近完成大额融资,您怎么看资本这​么高的关​注?

有分析指出,​

程昊​:这是资本融资​的特​点。一两年前,可能有个本体能走起来,拍个demo就能融​到钱,接下来谁能启动出货,能否在更多场景落地,实现大规模的可靠​量产,才能持续发展。

XM外汇资讯:

搜狐科技:公司在6​月初宣布了A轮融资,接下来会加快融​资吗?

程昊:咱们​不会那么激进地把估值推特别高,融特别多钱。我之前创业也经历过估值一下翻十倍的情况,就很容易飘,诸位知道吗?估值特别高,投资人也会希望诸位做一些更fancy的事情,这样才能不断推高估值。

但咱们觉得​现阶段,尤其是​对于一​家不到两年的初创企业来说,把内功打好更主要。咱们也有取舍,比如没有花精力去做翻跟头、高速奔跑的能力,这些在我看来在第一阶段帮助不大。

搜狐科技:王兴兴此前说宇树年营收已达到10亿,加速进化目前是数百台订单,未来商业化上有什么规划?

据业内人士透露,

程昊:宇树毕竟十年了,咱们觉得以他们的积累今年做到十几亿营收非常有希望。咱​们会定自己的目标,而不是盲目去追高,那样的话很​容易动作变形。

有分析指出,

我觉得核心还是要每一步都走扎实,第一年高速把产品做出来,去年10月启动正式售卖和量产,生产制造能力从一周只能生产3台到几十台,接下来要提升到一周生产几百台的水平。

咱们现在坚定不搞大订,而是在客户下单后很快出货,帮助客户做成。现在还没有到要把销量做到非常大的阶段,还是修炼内功的阶段,人形机器人市场真正爆发的时候还没到。返回搜狐,查看更多

admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: