尤其值得一提的是，DeepSeek完成7亿美元C轮融资？多位投资人称是假消息；R2延迟发布，背后资方规模缩水

发表评论

A+

所属分类：科技

摘要

有媒体报道援引三位知情人士的话称，“DeepSeek-R2的训练遭遇了华为芯片持续出现的故障，导致模型发布延迟。” 美国杜克大学电气与计算机工程专业的杰出教授陈怡然向搜狐科技表示，“不清楚梁文锋具体为什么不…” />

XM外汇财经新闻：

出品｜搜狐科技

作者｜梁昌均郑松毅

站在用户角度来说，

编辑｜杨锦

事实上，

DeepSeek新模型没等来，新融资的消息却先吸引到了圈内关注。

但实际上，

8月15日，有消息称，“据企查查消息，DeepSeek已于8月14日完成超过7亿美元的C轮融资，由国家产业投资基金领投，多家顶级风险资本、科技巨头投资部门以及主权财富基金等共同参与。本轮融资后，DeepSeek估值突破80亿美元。”

可能你也遇到过，

消息传出后高速在圈内发酵，搜狐科技随即向企查查方面求证，相关负责人表示，“消息来源不明，官方网页中相关资讯消息为机器自动抓取，已做删除处理。”

有分析指出，

另有多位投资人向搜狐科技表示“投资圈普遍认为是假消息，投资参与者信息模糊。且DeepSeek此前并未有融资，直接进入C轮很蹊跷。”

可能你也遇到过，

其中，一名业内人士向搜狐科技展示了一则对话，对话中一名疑似DeepSeek人士调侃道，“（是）企查查帮本平台融的，不是本平台融的。”

展开全文

另有业内人士向搜狐科技直言，“他们（DeepSeek）这个身位，肯定是不会要财务投资人钱的。国家给了非常多资助和容许。像王坚院士领导的之江实验室，展现了几十亿的算力容许，基本是倾囊相助。”

搜狐科技向DeepSeek致电求证，DeepSeek相关工作人员表示来电提问已登记，暂不知情。截止发稿，搜狐科技尚未收到回复。

大家常常忽略的是，

梁文锋曾拒绝盲目商业化，称“不着急融资”

两年前，梁文锋决定下场做大模型后接受媒体采访时表示，当时有找不同出资方谈融资，但接触下来，感觉很多VC对做研究有顾虑，他们有退出需求，希望尽快做出产品商业化。

综上所述，

“按照本平台优先做研究的思路，很难从VC那里获得融资。”梁文锋表示，幻方作为出资人之一，有充足的研发预算，另外每年有几个亿的捐款预算，如果需要也允许进行调整。

XM外汇快讯：

今年春节，DeepSeek爆火后，整个投资圈传出VC错过DeepSeek的说法，和DeepSeek北京公司同在一栋楼的百度风投曾就因此面临过质疑。

随后不少投资人都尝试和梁文锋进行接触，希望参与融资。此前表态坚决不投大模型的金沙江创投管理合伙人朱啸虎甚至也转变态度称，“我肯定会投，价格已经不太关键了，关键是参与在这里面”。

当时有媒体报道称，腾讯和阿里等科技公司高管与梁文锋会面，探讨潜在的合作机会，但梁文锋表示现在并不急于融资，缘于担心外部投资者会干预公司决策。

XM外汇认为：

后来，市场有消息传出阿里将以100亿美元的估值注资DeepSeek，从而获取其10%的股份。但随后，阿里副总裁颜乔对此进行了否认，阿里公关团队也同步发表了否认声明。但当时有消息称，DeepSeek正与投资人接触，估值是80亿美元。

概括一下，

此前，DeepSeek还放出了多个财务相关岗位，涉及CFO、COO、财务副总裁、财务总监等，引发市场对DeepSeek开放融资的猜测。不过，有业内知名投资人对此表示不清楚。

XM外汇快讯：

《新财富》杂志发布的创富榜显示，梁文锋以1846亿元财富首次上榜即闯入前十，而彭博调研给予DeepSeek约300亿美元估值预期。

说到底，

是什么让DeepSeek“沉默”？

XM外汇报导：

自DeepSeek成为国产“AI黑马”，凭低成本比肩海外顶尖模型以来，AI圈始终对其保持高度关注。

有分析指出，

然而，DeepSeek新模型发布一再“跳票”，相较于外媒《路透社》最早披露的5月初发布计划，R2的亮相迄今已推迟近百天。

简而言之，

究竟是什么原因，在海外OpenAI、Google等一众大厂发起猛攻时，DeepSeek却保持了“沉默”？

有媒体报道援引三位知情人士的话称，“DeepSeek-R2的训练遭遇了华为芯片持续出现的故障，导致模型发布延迟。”据报道，DeepSeek被迫改回处理英伟达芯片进行训练，同时处理华为芯片进行推理。

根据公开数据显示，

报道表示，“DeepSeek进行的选取是依赖于华为Ascend（昇腾）平台进行模型训练，而非英伟达。但这一举措很快遇到了困扰，包括性能不稳定、芯片间连接速度较慢，以及华为 CANN 软件程序包的局限性。”

事实上，

据知情人士介绍，“华为已派遣一个工程师团队前往DeepSeek的数据中心，试图处理训练困扰。但该公司从未在Ascend（昇腾）平台上成功进行过一次完整的训练。”

尤其值得一提的是，

从业内普遍讨论来看，DeepSeek选取华为平台的一方面原因是力争实现国产芯片加入大模型实战的关键突破，而另一方面与美国对英伟达H20芯片出口的新一轮升级管制脱不开关系。

尽管如此，

据SemiAnalysis公开信息显示，R1处理芯片量包括3万张H20，1万张H800，以及1万张H100。R2若进行全面部署，对算力的需求只增不减。然而受限于美国芯片的出口管制，让DeepSeek“巧妇难为无米之炊”。

从某种意义上讲，

浙江大学计算机学院智能所和人工智能协同创新中心的百人计划研究员王则可认为，“H20主要针对推理场景优化。虽然大模型训练和部署主要依赖于H100等高端卡，但H20的短缺会对大模型的推理能力造成直接影响。”

总的来说，

除芯片外，业内认为DeepSeek新模型延迟发布的另一原因是性能表现未达到梁文锋标准。

XM外汇用户评价：

据知名投行摩根士丹利近期发布的研报透露，新模型R2将采用混合MoE架构，主打编程、多语言推理、及多模态能力。总参数量从R1的6710亿直接飙升到了1.2万亿，活跃参数也从之前的370亿涨至780亿。

通常情况下，

这意味着，R2每次思考时，会调用多一倍数量的“脑细胞”来处理困扰，思考的深度和质量都会发生质的变化。同时按DeepSeek风格，依然在追求低成本实现。

说到底，

该研报分析，R2的输入成本，将达到每百万Token仅需0.07美元（R1是0.15美元）；输出成本，将达到每百万Token仅需0.27美元（R1是2.19美元）。

值得注意的是，

但可能正缘于目标过高，反而卡在了发布前的“最后一公里”。

据The Tech Basic报道，“R2在内部基准测试中的表现并未对R1形成全面碾压，尤其在编程、推理等关键指标项上能力提升有限。”CEO梁文锋坚称，“达不到标准，就不发布。”

据报道，

美国杜克大学电气与计算机工程专业的杰出教授陈怡然向搜狐科技表示，“不清楚梁文锋具体为什么不满意，但R2肯定是要与这些顶尖模型进行对标的，不说超越但至少不能差太远，允许理解DeepSeek会对发布比较谨慎。”

站在用户角度来说，

可见的是，眼下DeepSeek没有选取一味追随竞品发布节奏，而似乎在等待“精准出击”。

母公司幻方量化规模缩水

不妨想一想，

DeepSeek的主要资金来源于梁文锋旗下的量化投资公司幻方量化。

XM外汇资讯：

据私募排排网数据，2018年之前，幻方量化的规模只有几十亿，此后逐步形成“北九坤、南幻方”的市场格局，2019年成长为百亿私募，2021年更是成为首家突破千亿资产规模的量化投资机构，但随后因业绩 XM官网回撤缩水至2024年的约450亿元。

概括一下，

这背后则主要是幻方量化的盈利波动导致。公开数据显示，在2024年百亿私募业绩排名中，幻方以12.18%的收益率均值和13.02%的中位数位列第19名，勉强跻身TOP20，远落后于头部机构，如东方港湾高达60.59%的收益。

尤其值得一提的是，

同时，幻方旗下基金盈利差距显著。据同花顺数据显示，该公司截至去年底共有65只基金公开披露净值，其中有29只基金年内涨幅超过10%，其余基金年内下跌，最大跌幅超6%。

可能你也遇到过，

今年上半年，幻方旗下11只产品平均收益为24.75%，继续稳居百亿量化前列。来自量化投资与机器学习的数据显示，目前幻方和衍复、明汯、九坤以600亿元至700亿元区间的管理规模成为新的量化四大天王。

如果DeepSeek坚持不融资，那么幻方量化的资产规模和投资收益将是其未来关键的资金来源。

很多人不知道，

SemiAnalysis早期发布的一份报告估计，DeepSeek总服务器资本支出约为13亿美元，其中仅集群运营成本就高达7.15亿美元。

XM外汇财经新闻：

同时，该机构提到，DeepSeek的团队规模超百人，且扩张速度极快，而薪资水平也远超中国其他科技公司，为顶尖研究人员开出了超过百万美元的年薪。

随着对R2等大模型的持续投入，包括算力等基础设施、人才招揽等，DeepSeek的资金需求恐也将持续增长。返回搜狐，查看更多

发表评论取消回复