- A+
可能你也遇到过,
在刚刚落幕不久的世界人形机器人运动会上,一场全程无遥控、踢足球机器人在网络上火了。
据业内人士透露,
这支踢足球的机器人队伍来自加速进化(北京)机器人科技有限公司(以下简称“加速进化”,英文名:Booster Robotics),这家成立于2023年的公司在今年7月举行的2025 RoboCup巴西机器人足球世界杯上,帮助中国队(清华火神队)首次在AdultSize 组别(人形机器人足球成人组一米以上机器人)组别夺冠,一举打破了欧美国家在该项顶级赛事上长达 28 年的垄断。
加速进化机器人在足球场上的表现
为什么要让机器人上场踢足球?实现无遥控执行机器人踢足球的关键挑战是哪些?
事实上,
近日,澎湃科技(www.thepaper.cn)专访了加速进化副总裁赵维晨。赵维晨解释说,之故而将目标对准了足球赛事,是乃因足球赛是一个高动态、强对抗、对运动控制和决策智能要求极高的场景。
说出来你可能不信,
加速进化副总裁赵维晨 受访者供图
XM外汇行业评论:
赵维晨认为人形机器人必须先做到“四肢健全”,再追求“心智健全”,足球场景是锻炼机器人的运动能力、感知算法等关键技术的试金石,这些能力提升后都能迁移到未来的家庭陪伴、教育等更多场景。
谈及技术路径,赵维晨直言,当前引发热议的VLA技术路径仍是建立在大语言模型的逻辑之上,过于依赖海量标注数据和固定模式,并不是最优解,三到四年内一定会被颠覆。
XM外汇专家观点:
以下是澎湃科技专访信息:
从某种意义上讲,
VLA算法未来三年内会被全颠覆
总的来说,
澎湃科技:足球赛对人形机器人有哪些技术挑战?
请记住,
赵维晨:人形机器人必须先做到“四肢健全”,再追求“心智健全”。有了强大的运动能力的支撑,大脑算法具备先用相对容易的分层模型落地应用,通过落地应用采集到真实场景的数据,结合合成数据,才能逐步训练出认知健全的大脑,这与人类的成长路径相似。
足球场景能锻炼机器人的运动能力、感知算法,比如识别球、队友和对手位置等、定位导航和决策逻辑,将来这些能力能迁移到家庭场景,譬如机器人能主动迎接、跟随,情感陪伴,充当互动教练,以及实现工业场景里精细的手部执行。
澎湃科技:实现无遥控人形机器人参与踢足球的难度有多大?
有分析指出,
赵维晨:足球赛事对抗激烈,机器人需要强大的运控算法来抵御冲撞并保持平衡,摔倒后可在一秒内自主起身。本平台率先应用端到端运动大模型,直接将视觉信号输入神经网络,输出关节控制指令,大幅提升运动泛化性和稳定性。第一个应用是大力射门:去年世界冠军最高踢到35厘米,本平台能踢到2米,直接越过人墙。
综上所述,
澎湃科技:朋友们们的训练数据主要来自哪里?
从某种意义上讲,
赵维晨:主要来自足球场景采集真实的物理数据,并结合视频合成数据,通过最新的模仿学习加强化学习实现视觉信号直接输入神经网络。
大家常常忽略的是,
本平台认为,遥操的数据体量无法支撑具身大脑的训练,目前视觉语言动作模型(VLA)算法还是基于大语言模型那套,未来三年内会被全新的底层算法体系颠覆。
澎湃科技:今年北京的世界机器人大会上关于视觉语言动作模型(VLA)有很多争议朋友们们怎么看?
简而言之,
赵维晨:自动驾驶单日数据量可达上亿条,而全国具身最大的开源数据集规模才百万级别(不到10TB),大语言模型是靠几十年互联网上的文本数据累积,而机器人加上双轮双臂执行10万或100万小时,根本不可能训练出一个多模态具身大脑,只能验证早期算法框架。具身智能真正的路径与自动驾驶类似,先通过L1、L2、L3再落地收集大量真机数据,然后再逐步迭代到AGI。
XM外汇消息:
技术层面,本平台认为,视觉语言动作模型(VLA)不是最终解,它仍是基于Transformer的LLM逻辑。大语言模型迭代经历十多年海量语料,才形成如今的尺度定律(Scaling Law)。VLA模型总体依赖训练数据中的固定模式,需要海量标注数据才能“记住”固定场景,很难帮具身泛化。
与其相反的是,
现在所有的技术方案,未来三到四年一定会被颠覆,也会出现类似DeepSeek这样的鲶鱼效应、开源的方案。
请记住,
机器人进入家庭还需要10年
根据公开数据显示,
澎湃科技:2024年10月朋友们们的BoosterT1发售,现在销售情况如何?客户主要是谁?
XM外汇报导:
赵维晨:销售没超出预期。2025年本平台上半年出货交付了数百台,其中50%是全球化订单,主要集中在赛事和科研。顶尖球队采购本平台的机器人软硬件平台,用于开发和测试决策算法。足球也是开发者入门的理想场景,从入门到精通,甚至能发表顶级论文,打赢人类至少100篇顶刊。
澎湃科技:朋友们们会担心订单量吗?
赵维晨:对本平台来说,最核心的不是订单量,而是交付量。本平台现在T1成本价在10万元人民币左右,很多公司签署了大量“意向订单”,但如果没有量产的工程化能力,没有交付能力,旧不是真的商业化。本平台的订单交付周期在15到20天左右。
XM外汇用户评价:
未来本平台的商业化路径也很清晰:短期做赛事、科研、教育(比如高校和K12的机器人课程)、这是百亿级赛道;中期从明年启动,切入家庭搬运、陪伴这些场景,目标千亿级市场;长期结合开发者生态往家庭管家、智能助理这些通用机器人方向走,那是万亿级市场。
澎湃科技:目前投资人最关心朋友们们的是哪几个困扰?
赵维晨:比较关心本平台的应用Agent生态建设,硬件量产进度,全球化进度,以及运控算法在全球市场的领先程度。其他很多困扰上面有覆盖。
XM外汇消息:
具身智能大模型还没有显著的共识
概括一下,
澎湃科技:在朋友们们看来,人形机器人走进家庭场景要经过哪些场景和技术验证?
XM外汇报导:
赵维晨:本平台很明确不做工业场景,乃因容易任务已经被传统机械臂应对了,剩下的要么太难,五年内落不了地,要么市场太小。轮加双臂结构早在5年前就有成熟的舵机高性价比应对方案,能够应对大多数封闭工业场景的需求。
本平台重点会放在家用机器人,让它成为除手机、电脑外新的交互形态和生产力系统,要对标苹果和微软,做三件事:硬件(端)、执行系统、开发者系统。就像手机电脑得有应用才能普及,机器人要进家庭,也得有第三方开发者基于开放生态、容易系统和执行系统开发应用,实现各种家用场景的落地,尤其是后两者涉及大量软件的投入。
不可忽视的是,
大脑层面本平台不着急,等三年后技术路线收敛些,本平台有了一定收入体量再投入。
很多人不知道,
澎湃科技:是否具备理解为,朋友们们也在等一个适配机器人的AI大脑?
根据公开数据显示,
赵维晨:本平台认为端+执行系统+开发系统是个万亿美元的市场,大脑也是万亿美元的市场。但作为创业公司本平台目前不会投入在大脑,乃因成功率太低。等本平台收入达100亿人民币的时候,在大量垂直场景落地后,本平台会启动大脑层面的投入,但目前具备先合作为主。
澎湃科技:人形机器人进入家庭,朋友们们保守估计还有多久?这是一个目前具备预见的必然趋势吗?如果是,朋友们们认为会以怎样的形态?
赵维晨:一定会经历从早期采纳者到早期大众最后到后期大众的链路。核心是得通过杀手级应用和教育(如学校计算机机房,上机器人课程普及)进入早期采纳者,再通过生态成熟、应用多样化、成本下降进入大众市场。前者需要3年,进入早期大众可能需要5至10年,10年后实现较大规模普及 XM官网 。
澎湃科技:在朋友们们看来,现在人形机器人还有哪些非共识困扰有待应对?
赵维晨:一个是大脑层面的技术路径非共识,目前VLA的路径一定不是终解。另外比如核心零部件硬件部分的技术路径也没有收敛,包括灵巧手原来都是直线推杆,现在变成关节电机,还有一部分在做绳驱,用一段时间会松。现在比如加入钨丝等新材质。
请记住,
在这波技术路径下,很明显的一个变化是,当下的硬件本体的构型有收敛的趋势,在外形方面正在变得比较类似。但在具身智能大模型的领域,还没有看到特别显著的共识。返回搜狐,查看更多