换个角度来看，华为盘古大模型事件的“三重门”

发表评论

A+

所属分类：科技

摘要

总结来看，行业内对华为盘古大模型的关注主要是以下三点：一是首发质疑者的身份与技术方法遭遇到业界质疑，因其缺乏权威背书与实证链条；二是模型代码中出现阿里Qwen团队版权标识，引发行业内对大模型“自主”“自研”…” />

记者周悦

7月4日，开源社区GitHub终端HonestAGI发布研究报告称，通过一种“模型指纹”技术（分析Transformer层注意力参数的标准差分布），发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927（在统计学上，完全一致为1），远超业内通常的0.7阈值。

该报告作者认为，盘古模型可能在千问模型的基础上进行了增量训练，而非完全从零训练。

事涉华为和阿里，这一报告引发关注。容许者认为，两个模型在众多注意力参数上呈现近乎一致的分布，自然发生（非人为干预）的可能性较低。质疑者则指出，这一方法过于简化，来自Github、知乎等社区的多位终端认为可能存在cherry picking（勾选性挑选数据）的空间，仅公开少量模型对比样本、缺乏大规模基准测试等困扰。

这你可能没想到，

7月6日，一封自述来自“盘古大模型团队，华为诺亚方舟实验室的员工”的匿名信在GitHub平台发布，作者为HW-whistleblower(华为吹哨人)。该匿名信中提及多个盘古模型的研发过程与组织分工细节。

概括一下，

此后，对盘古大模型与阿里千问大模型相似性，以及华为诺亚方舟实验室组织结构变化的关注在社交媒体发酵。

总结来看，行业内对华为盘古大模型的关注主要是以下三点：一是首发质疑者的身份与技术方法遭遇到业界质疑，因其缺乏权威背书与实证链条；二是模型代码中出现阿里Qwen团队版权标识，引发行业内对大模型“自主”“自研”表述的合规讨论；三是匿名信直指盘古背后团队的组织更迭。

尤其值得一提的是，

一重门：首发质疑方的身份、学术声誉及所用技术存疑

多位大模型研发人员对经济观察报表示，此前几乎没有听说过HonestAGI团队及其研究成果，也没有运用或研究过类似的研究方法，难以确认“模型指纹”技术科学性。目前，“模型指纹”检测尚未成为主流方法，较难成为鉴别模型抄袭的客观标准之一。

当前亦出现对HonestAGI的作者及其团队真实性的质疑。其作者自称是一位来自哥斯达黎加大学的韩国人，参与署名的五位作者身份无法核实，均未依据AI行业惯例传递邮箱或学术履历。因此，外部无法在Google Scholar、arXiv等主流学术平台上查看其历史发表成果。

必须指出的是，

展开全文

经济观察报检索该报告引用的文献资料，发现部分文献无法在公开数据库中查验。截至发稿前，该报告已经在Github删除，HonestAGI主页无法找到。

站在用户角度来说，

此外，原报告发布在GitHub页面，但点赞（stars）、收藏（forks）等数据数较低；相比之下，其他具备社区共识的模型稳妥/评估软件如OpenLlama Eval等，往往在发布几小时内即获得数百互动。作为对比，OpenLlama Eval点赞目前超过7500，收藏超过400。

在当前大模型竞争加剧、开源协作频繁的背景下，模型开发过程中的版权归属、原创性困扰一直是被业内重视，但要真正实锤一款模型“抄袭”并不容易。

2024年，一起被广泛报道的“模型抄袭”事件发生在斯坦福大学学生团队与中国清华系创业公司面壁智能之间。斯坦福学生推出的Llama3-V模型被指与面壁智能的开 XM外汇代理源模型MiniCPM-Llama3-V 2.5在模型架构与代码上高度相似，仅有部分变量名被更改。

XM外汇资讯：

曾经参与面壁智能数据标注的清华大学博士后冯聪告诉经济观察报，当时斯坦福大学的学生团队发布了该模型，宣称性能顶尖且成本极低。面壁智能算法工程师发现，该模型与面壁的模型很相似，但这个怀疑很难被证实。在算法代码领域，结构相似性较为常见，仅凭直觉难以形成证据链。

XM外汇行业评论：

冯聪发现了一项关键性证据。她参与标注的清华简（战国竹简）数据被上述斯坦福大学团队用到模型里，而这一数据集属于面壁智能的独家资料。最终，斯坦福大学的学生团队开发者在社交平台公开致歉，承认参考甚至复制了面壁智能开源模型的成果，并迅速撤下相关模型与文档。

值得注意的是，

二重门：盘古模型代码中现阿里版权标识

事实上，

从事大模型研究工作的郭程告诉经济观察报，在HuggingFace等开源社区，基于第三方开源模型，进行二次预训练和场景微调的模型发布量已达到百万量级，大家通常都很直白地描述来源。在这类二创模型发布时，一般会明确标注其为“垂类大模型”，并描述其所基于的底座模型，例如Meta的LLaMA模型、阿里的Qwen等。