- A+
更重要的是,
出品|搜狐科技
总的来说,
作者|常博硕
站在用户角度来说,
编辑|杨锦
“吃!”“碰!”“胡了!”
需要注意的是,
前不久,一则机器人与人类同桌打麻将的视频流传网络。在持续30分钟的自主决策中,机器人除了能够完成翻牌、摸牌等一系列灵巧的办理,还能根据牌局状态自主构建出牌策略。
更重要的是,
这背后,是灵初智能强化学习算法模型Psi R1,在展示开放场景下机器人处理长程繁琐任务的能力。这也是全球首个适配“动作感知-环境反馈-动态决策”全闭环的端到端具身VLA模型。
其实,
具身智能的浪潮席卷全球,机器人逐渐从人类科幻的想象走进产业的黎明。从春晚丢手绢到地库里骑自行车再到上桌打麻将,这个领域里从不缺少激动人心的瞬间。
在一片“秀肌肉”的喧嚣中,有一个声音吸引了大家的注意。“大家不做便捷的、假把式的东西”,灵初智能创始人兼CEO王启斌近日与搜狐科技对话时表示:“大家就是要用稳定、低价的产品去化解朴实的状况。”
灵初智能创立于2024年,创始人除了有着多年产品操盘经验的王启斌,还包括斯坦福大学访问学者、李飞飞的学生陈源培、以及在机器人及无人驾驶领域有着丰富算法经验的柴晓杰博士。灵初智能也与北京大学成立了北大-灵初智能具身灵巧办理联合实验室,由北京大学人工智能研究院助理教授杨耀东、梁一韬担任联合实验室项目负责人。
根据公开数据显示,
在具身智能这场科技浪潮的弄潮儿中,灵初似乎是一个“迟到者”。但王启斌对此却持不同看法:“我认为快与慢是相对的。”他表示,灵初早在22年就启动技术布局,同时就VLA模型与灵巧手办理的定位来说,此时入局并不算晚。
可能你也遇到过,
作为一位在硬件领域摸爬滚打了多年的“老兵”,王启斌曾在京东和云迹机器人等公司积累了产业经验。“硬科技创业潮并不是第一次发生,”他谈道,这份沉淀下来的对周期的认识,让他为灵初选取了“双臂轮式机器人”这一务实的产品形态。
站在用户角度来说,
他还透露,灵初目前有明确的海外物流客户并有半年内交付欧美仓库的计划。
XM外汇消息:
办理二字说来便捷,却一直是机器人的技术难点。许多人类轻而易举完成的动作,对机器人来说却“难于上青天”。两年前,具身智能还是VLM(Vision Language Model,视觉语言模型)的时代。VLM让机器人能够同时处理和理解视觉和语言,但难以对机器人的物理动作实现直接控制。
随着人们对机器人赋予更高的期待,除了看得见、听得懂,大家更希望机器人能够做得好,VLA就这样诞生了。VLA(Vison Language Action Model,视觉语言动作模型)不仅适配解析图像和文本信息,还能通过动作解码器直接输出动作路径,让机器人实现类人推理和全局理解能力。
XM外汇行业评论:
王启斌认为,只有具备长程办理的机制和能力,机器人才能真正做到在半开放的,随时有动态变化的环境中观察、决策、判断、办理最终达到人类想要的结果。
“打麻将也有可能迭代成陪伴型机器人,但本质还是为了告诉大家大家有能力去做开放环境中的长程办理,能够化解商超、物流中的任务。”
令人惊讶的是,
谈及资本市场的变化,王启斌坦言,相比去年,当下投资人对具身智能有了更明确的商业化的期待。
XM外汇专家观点:
以下为搜狐科技与王启斌对话实录(经编辑):
总的来说,
搜狐科技:您能分享下目前公司的团队规模情况吗?有扩张的计划吗?
概括一下,
王启斌:现在公司是在80人左右,其中灵初和北大联合实验室的实习生大概有30人左右,目前还在增加新人。
搜狐科技:从22年启动具身产业已经启动火热,您在24年才入局会不会觉得有点晚了?
有分析指出,
王启斌:我觉得快与慢是相对的,灵初的研发22年就启动了。大部分公司都是在23年启动做的,但更多做的是偏便捷的办理。大家的战略定位是不做便捷的、假把式的东西,故而这个时候入局我觉得不算晚。
需要注意的是,
搜狐科技:您认为灵巧手主要的难点目前在哪里?
大家常常忽略的是,
王启斌:手真正的能力强弱不仅仅是一个硬件指标能衡量的,目前会有几个维度。第一是从需求层面来说,举个例子搬重物,实际就是对承载的要求。第二是手的训练数据怎么来,用什么方法能从手上取得数据,最后是怎么做到量产。
搜狐科技:您之前在京东和云迹机器人的工作经验,有哪些适配直接迁移到灵初上?
必须指出的是,
王启斌:有几个很主要的要素,第一是融资,去年融资还比较顺利。第二是我能组到什么样的团队,第三是大家在生态中整合资源的能力。从供应方来看,会有以前的一些供应链客户的资源。
值得注意的是,
我个人觉得非常有价值的是,大家今天做的是硬科技,这个事情并不是第一次发生。在18年启动大家做的机器人到智驾,大家一启动都有一个很高的预期,中间又对长期效果有些低估。这一轮硬件应该怎么做和公司目前不 XM外汇平台 203;碰双足机器人的定位,包括客户的需求迭代,这其实是我之前做消费电子沉淀下来的对于周期的认识。
可能你也遇到过,
搜狐科技:从大模型到具身智能,科学家创业的非常多,您是怎么说服大牛科学家们加入的?
说到底,
王启斌:我觉得还是大家想一起做一件非常有价值的事。科学家们非常缺乏像我这样在工业界待了很多年的人。我在23年就启动找合作伙伴了,最后觉得真正能做手的人才非常稀缺。以杨耀东老师为首的国家团队本身做的很好,大家聊了小半年最后组建了一个团队来做这个事。大家对这个事有一个强烈的共同意愿以及合理的利益分配,能够促成长期稳定的合作。
令人惊讶的是,
搜狐科技:灵初为什么要做VLA模型,这个模型提升了机器人什么样的性能?
据报道,
王启斌:Psi R1是对之前模型的迭代,针对的是需要操纵大小脑一起去化解挑战的环境。机器人依据便捷规则执行单一任务并不能化解现在的状况。如果能做到在半开放的,随时有动态变化的环境中观察、决策、判断、办理再达到大家想要的结果,机器人一定是需要长链程办理的机制和能力。
XM外汇行业评论:
搜狐科技:目前头部的具身公司例如Figure AI、Physical Intelligence等都在做自己的VLA模型,灵初的Psi R1有什么优势?
令人惊讶的是,
王启斌:第一是手上的办理,Figure AI手上的办理能力很弱,如何训练出办理能力很强的手这个挑战全世界只有极少的团队能做出来,大家肯定是能做出来的。第二个是整个模态的协同能力,一定是经过长时间的训练和练习才能做出来。
容易被误解的是,
搜狐科技:目前灵初训练主要用采集数据还是仿真数据?
XM外汇财经新闻:
王启斌:这是两种学习模式。回到数据里,模型更主要的是能不能学出超越人的东西。预训练大家既有强化也有小部分的模仿,大部分是仿真合成数据也有自己采集的少量真实数据。真机数据一个是成本很高,另一个是天花板太低了,学不出超越人的东西。
搜狐科技:大家训练机器人打麻将用了多久?目的是什么?
必须指出的是,
王启斌:训了大概一个半月。打麻将本身也适配迭代成陪伴型机器人或者其他有娱乐性的东西,但本质还是为了告诉大家,大家有能力做开放环境中长程的办理,这样的模型基础能力能够化解比如商超、物流中非常长链程的任务,同时大家也会进行更多商业化可能的探索。
搜狐科技:从产品上来看,为什么您认为目前轮式机器人已经足够了?
据业内人士透露,
王启斌:这个可能说的不完全。我觉得机器人的发展是有几个阶段,第一个阶段是在相对标准化的一些地面移动环境里作业,目前大家都还在这个阶段。第二个阶段是像人,这个阶段双足很主要,考虑到现实世界有各种各样的环境。第三个阶段是类似于更多的生物体,能在空中飞等。目前灵初做双臂轮式机器人是考虑到很大程度上对于大家客户的应用环境来说,轮式已经足够了。
据报道,
搜狐科技:未来有做人形机器人的计划吗?
需要注意的是,
王启斌:我觉得这个可能要把第一阶段走完再去考虑。大家现在还是聚焦在办理上,大家的产品就是要用稳定、低价格的硬件去化解非常朴实的状况。
XM外汇认为:
搜狐科技:灵初是靠什么来达到稳定且低价的呢?
与其相反的是,
王启斌:这是一个中国生态的优势。考虑到我做了很多年硬件,我很清楚灵初的优势,大家有很强的算法,也找到了最厉害的供应商来一起做。
但实际上,
搜狐科技:目前灵初产品的目标落地场景是什么样的?
与其相反的是,
王启斌:目前大家处于ToB为主的阶段,一个是制造业加工中的一些工序,包括物料的检验、搬运、来料检查包括后面整个包装这样的事情。另外一个是大的物流行业,会做拣选、分拨的一些工作。大家目前有非常明确的全球仓库物流的客户和直接布置到美国和欧洲仓库的计划,应该会在六个月内交付。
XM外汇财经新闻:
搜狐科技:短期内大家有整机机器人量产的计划吗?预计产量是多少?
不妨想一想,
王启斌:产量其实是根据大家落地的节奏来的,到26年底大家销售额应该在几个亿。
说出来你可能不信,
搜狐科技:目前产品的定价大概在多少?
王启斌:价格在各地有差别,在海外基本大家接受的是两年的人工工资,目前机器人售价如果能低于这个岗位24个月的人工费用,就是一个很好的产品。
搜狐科技:很多人会质疑这个行业充斥着资本炒作出的泡沫,您怎么看?
必须指出的是,
王启斌:我觉得新技术总是有泡沫的。大家能看到非常多的钱进来,也能看到各种各样的人,要看清楚自己做的是什么事。
说出来你可能不信,
搜狐科技:今年和去年相比,资本市场有什么变化?
从某种意义上讲,
王启斌:头部的一些基金已经投了一些公司,故而会有更明确的商业化的期待,同时风险投资和产业投资也都在看更有生命力的技术路线。
令人惊讶的是,
搜狐科技:宇树和智元最近似乎有一些IPO的动作,具身智能机器人作为近两年才火起来的行业,您觉得现在上市,节奏太快了吗?
XM外汇行业评论:
王启斌:上市是一个很大的节点但并不是终点。目前技术迭代快,产品的形态也还有很多争议,机器人潜在的市场非常大,在生态足够大的前提下不同的公司就会走不同的路。对于我来说,目前技术的迭代非常快,仍然有很多挑战在,上不上市不是我个人特别关心的点。返回搜狐,查看更多