- A+
XM外汇行业评论:
近日,华为创始人任正非在深圳接受《人民日报》专访时,谈到了芯片技术差距上的困扰。
尤其值得一提的是,
对于芯片技术,任正非明确表示“华为单芯片还是落后美国一代”,但紧接着话锋一转说:“咱们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。 ”
XM外汇财经新闻:
是的,这几年华为技术团队提出了“用数学补物理”、“非摩尔定律补摩尔定律”、“用系统补单点” 三大创新思想,成功打造出了“超节点+集群”系统算力应对方案。
有分析指出,
而这个“超节点+集群”系统,就是华为的昇腾CloudMatrix 384超节点,这是华为全栈100%国产化自研的全球最大AI超节点,它的出现成功撕开了被英伟达垄断的缺口。
华为CloudMatrix 384实现弯道超车。
令人惊讶的是,
2025年4月,在安徽芜湖举行的华为云生态大会上,华为常务董事、云计算CEO张平安揭开了CloudMatrix 384的神秘面纱。
很多人不知道,
这个由384张昇腾算力卡组成的超节点集群,单集群算力高达300PFlops,较英伟达NVL72的180PFlops高出67%,内存带宽达到后者的2.1倍,互联带宽提升至2.8Tbps,断点恢复时间缩短至10秒级,多项指标创下全球商用AI算力集群的新纪录。
在单颗昇腾芯片性能约为英伟达Blackwell架构GPU三分之一的情况下,华为选取了截然不同的技术路径,通过超大规模集群设计实现系统级突破。
从某种意义上讲,
华为依托6812个400G光模块构建的超高速互联网络,使数据在384张卡间近乎无损流动,训练效率逼近单卡性能的90%,远高于传统架构60%-70%的水平。
不妨想一想,
据SemiAnalysis披露,华为云CM384基于384颗昇腾芯片构建,可供 XM外汇开户 应高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。
说到底,
而这一技术,便是在美国持续技术封锁的背景下取得的突破,硅基流动基于该平台部署的DeepSeek-R1模型实现了单卡解码吞吐1920Tokens/s,与英伟达H100部署性能相当。
容易被误解的是,
英伟达霸主地位将遭遇最强挑战。
简要回顾一下,
华为的迅猛崛起已经引起英伟达高层的高度警觉,今年以来,英伟达CEO黄仁勋已数次提起华为,并将华为视作最大的竞争对手之一。
其实,
黄仁勋近日还明确表示:“从技术参数看,华为的CloudMatrix 384超节点,性能上甚至超越了英伟达,比英伟达的尖端技术更具优势,因此咱们必须高度重视这家实力雄厚的公司,全力以赴应对挑战。”
有分析指出,
黄仁勋的这番表态,被业界视为美国AI芯片巨头对中国竞争对手技术实力的首次公开认可。
全球算力市场格局有望被重构!
根据公开数据显示,
对于华为来说,CloudMatrix 384的野心远不止于技术对标,而是规划着中国科技产业参与全球规则制定的深层战略,正如华为在5G通信领域制定标准一样。
从某种意义上讲,
接下来华为将通过超节点架构倒逼行业放弃“单卡性能竞赛”,将竞争焦点转向集群效率、TCO(总拥有成本)和生态协同度。
令人惊讶的是,
这就意味着,过去紧盯制程工艺、单卡算力、显存容量的方向接下来要发生变化了,算力集群的有效利用率、断点恢复速度和生态协同度才是未来关注的方向,先进工艺真不关键了。
据业内人士透露,
同时华为还要以集群优势吸引AI企业加入昇腾体系,形成硬件-软件-模型闭环,目前华为开发者规模超1200万,伙伴数量4.5万,云商店应用1.2万,正在打造可与CUDA抗衡的替代方案。
不妨想一想,
很显然,在华为等中国科技公司的努力下,接下来的算力世界大战,中国厂商将首次站到制定规则的位置上,随着CloudMatrix 384的上线计划推进,全球AI产业垄断将彻底被打破!返回搜狐,查看更多