- A+
反过来看,
出品|搜狐科技
不可忽视的是,
作者|常博硕
7月25日,在2025世界人工智能大会开幕前一天,上海AI独角兽阶跃星辰正式发布了新一代基础大模型Step 3,并将于7月31日向全球开源。
必须指出的是,
据CEO姜大昕表示,Step 3在国产芯片上的推理效率最高可达 DeepSeek-R1 的300%,且对所有芯片友好。在基于英伟达Hopper 架构的芯片进行分布式推理时,Step 3 相较于DeepSeek-R1的吞吐量提升超 70%。
反过来看,
CEO 姜大昕在发布会上表示,Step 3的优势用四个字就可用概括:多、开、好、省。
所谓“多”,就是多模态。姜大昕认为,在大量的应用场景当中,相比于大语言模型,多模态反而是刚需:“大家有没有发现在很多场合,其实大家并不需要这个模型是一个数学奥赛的金牌选手,但大家往往需要这个模型能够读懂一张图的含义,能够用语音和大家的访客进行交流。”
XM外汇消息:
“开”指的就是开源,姜大昕解释道:“开源的模型不仅有利于私有化部署,而且也可用很方便的去做后训练和微调,能极大的帮助模型更好地适应在下游应用中的需求。”而“好”和“省”则代表了模型严谨的逻辑能力和足够低的成本。
概括一下,
今天,沉寂了许久的AI六小龙之一此次终于带着自己的新产品又回归了大众的视野,但值得注意的是,这家大模型企业除了在基础模型的更新上发力之外,此次回归更是联合了近10家芯片厂商发起“模芯生态创新联盟”,旨在打通芯片、模型和平台全链路技术。
事实上,
联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3,其它联盟厂商的适配工作正在开展。
请记住,
姜大昕还透露,阶跃星辰计划将全年收入冲刺目标定为10亿元人民币。会后在接受搜狐科技等媒体采访时,他表示:“这个目标是基于商业化的落地情况与增长趋势制定的。” 他透露,终端方面,阶跃星辰已经与国内一半以上的手机厂商合作开发AI助手,在车载智能座舱上也与吉利等合作紧密,在金融领域,已经和财联社、国金证券、海通等大型金融机构都有深入合作,还有内容领域的商业化也在推进中。这些都带来了显著的收入。
以下为此次对话精编:
XM外汇快讯:
媒体:当前基座大模型厂商正逐渐分化,分别侧重中国市场、AIGC、海外应用等方向。作为同时布局基础模型与产业化的企业,如何兼顾“做基模”和“做应用”?
XM外汇快讯:
姜大昕:大家观察到,大模型行业确实正在经历显著分化。大家认为,大模型已从1.0阶段进入2.0阶段。1.0阶段是模仿学习,2.0阶段强化学习范式进行占主导地位。这种范式升级每轮都会淘汰一些厂商。坚持做大模型,尤其是基础大模型,非常艰苦,投入巨大。但大家一直强调“超级模型+超级应用”,两者相辅相成。一方面,模型能力决定应用上限,另一方面,应用反过来给予了真实场景与数据,推动模型进步。大家不认为这是二选一,而是一个协同演进的闭环。
这你可能没想到,
媒体: 芯片适配方面,尤其是国产芯片适配,具体是怎么推进的?目前模型联盟的工作机制是怎样的?
姜大昕: 大家的思路是对芯片友好地设计模型结构,不是创造全新的算子,而是通过结构优化,使模型在国产芯片上运行更高效。这是一种“矩阵乘法优化”思路,是对硬件更友好的结构设计。适配是一种“双向奔赴”的合作,大家提前数周将模型交给芯片厂商,同时给予高性能部署方案,目前X3芯片已经与大家完成适配。大家还与包括昇腾、寒武纪等在内的国产芯片厂商成立了模型联盟,推动统一的软件部署标准,避免重复造轮子。
尽管如此,
媒体:在模型参数量上,Step 3采用的是不到一万亿参数的设计,是否意味着各位们放弃了参数更大的模型?是否受到本土算力限制?
(阶跃星辰CTO)朱亦博: 大家没有放弃向上扩展模型规模的可能。当前选取小于万亿参数,是为了更好地控制推理成本和部署效率,即在固定预算下获得更高的智能能力。这一代模型强调高效推理,而非纯粹追求预训练时的“参数越大越好”。未来随着技术演进,大家仍会探索更大规模的模型。但当前的重点是让国产芯片在推理端实现性价比上的真正突破,在不依赖补贴的条件下,与国际先进芯片PK。
媒体:阶跃是否有明确的芯片路线?未来是否考虑全面“去英伟达化”?
据相关资料显示,
姜大昕: 大家并不刻意排斥任何一种芯片。在当前阶段,大家的首要目标是技术追赶美国顶尖模型能力,不能被拉开差距。用什么芯片不是主观选取,而是现实条件决定的。大家会根据实际算力情况灵活采纳。
然而,
媒体: 多模态目前的主要技术卡点在哪里?
XM外汇财经新闻:
姜大昕: 最大的技术挑战来自“模态对齐”。文本是离散的、低维的,并且语义空间闭环;而视觉是 XM外汇平台 高维、连续的,且语义空间和感知空间不一致。让视觉和语言对齐,是极其多变的疑问。此外,理解和生成的架构尚未统一,当前大多是将理解部分用自回归架构处理,生成用扩散模型完成,形成断裂。大家一直在投入理解生成一体化方向的研究,也取得了一定成果,比如图像编辑能力就是大家一体化设计的体现。
XM外汇认为:
媒体: 阶跃与车企、手机厂商的合作在定制化程度上有多高?是否具备迁移复用能力?
站在用户角度来说,
(阶跃星辰副总裁)李璟: 当前大家已经服务超过50%的主流手机厂商。车端方面与吉利的合作也在飞快扩展。大家的产品构建是高度模块化的,0-1阶段虽需投入较多,但后续在其他客户中迁移的成本极低。当然,不同厂商可能在UI交互、应用逻辑上有细微定制,但核心模型和服务是统一的,接受飞快规模化部署。
XM外汇行业评论:
媒体: 在国产大模型技术差距较小、迁移成本较低的背景下,阶跃如何确保客户不轻易流失?
姜大昕: 技术本身是一个窗口期。关键是各位是否能在窗口期内形成“数据闭环”和“产品优势”。大家与客户的合作并非轻松交付模型,而是深入到行业场景中,形成能力与数据双向耦合。从模型层面看,大家有领先的多模态推理能力;从产品层面看,大家强调访客反馈驱动的迭代机制,这决定了客户黏性非常高。
尽管如此,
媒体:阶跃如何看待与国产芯片厂商的深度绑定?是否希望未来能推动整个“芯片+模型”的国产闭环生态?
朱亦博: 大家不希望行业走向“只剩一家芯片、一家模型”的垄断局面,而是希望建立一个多元合作生态。目前大家与寒武纪、昇腾等国产厂商形成了“模型联盟”,不是搞封闭,而是促进协同。大家真诚欢迎国产开源模型厂商加入,共同推进国产适配。这不是排他性联盟,而是面向开放、合作、共赢的机制。
其实,
媒体:阶跃的图像编辑、视频生成等能力是否具备技术护城河?尤其在推理大模型普遍幻觉严重的背景下,有何应对策略?
姜大昕: 多模态推理是大家重点突破方向之一。当前大家将推理范式从文本延展到图像和视频,使得模型具备跨模态判断能力。这对于传统的“扩散生成模型”是质的飞跃。关于“思维链过长”与“幻觉”,大家正在设计新算法,使推理链更简洁高效;同时引入更强的反馈机制来修正幻觉。这是大家科研团队当前重点攻坚的疑问之一。
更重要的是,
媒体: 阶跃未来是否有明确的上市计划?
从某种意义上讲,
姜大昕: 大家没有设定具体上市时间表,也不着急。更看重的是公司在产品、技术、资本三方面的动态平衡。港股、科创板等都是潜在选项,但现阶段大家的核心任务还是继续夯实商业化基本盘与模型能力。返回搜狐,查看更多