核心模型被曝蒸馏DeepSeek？前女友一纸控诉，曝出欧版OpenAI塌房真相！

发表评论

A+

所属分类：科技

摘要

几天前就有人在X上爆料：Mistral的新模型是直接蒸馏自DeepSeek，而且基准测试结果还被歪曲了。也就是说，这位Mistral离职的女员工，不仅在小作文中曝光了自己和前男友、Mistral同事的感情…” />

尽管如此，

新智元报道

编辑：Aeneas KingHZ

反过来看，

【新智元导读】

曾被誉为「欧洲OpenAI」的Mistral AI，陷入「抄袭」丑闻！在分手小作文中，前员工爆料核心技术是蒸馏DeepSeek，却误导外界称为自主RL成果。

XM外汇资讯：

Mistal套壳DeepSeek，被当场抓现行了？

综上所述，

展开全文

几天前就有人在X上爆料：Mistral的新模型是直接蒸馏自DeepSeek，而且基准测试结果还被歪曲了。

这个被视为欧洲版OpenAI「全村希望」的公司，地位就如同中国的DeepSeek一般，如今居然塌房了？

站在用户角度来说，

这实在是太魔幻了。

更为劲爆的是，这个重磅大瓜还是从一篇Mistral女员工的「分手小作文」里曝出来的。

但实际上，

原话是这样的——

其实，

各位早知道Mistral做事不讲道德：把DeepSeek蒸馏后当成自己的模型，利用OpenAI的数据，对外却误导称是RL在发挥作用，但它实际上只是DS3的产物，还歪曲基准测试结果。

不妨想一想，

各位不仅明知这些，还积极参与其中。当我指出这些难点时，各位没有承担任何责任，反而勾选无视我、对我冷处理。

情感纠纷小作文

令人惊讶的是，

曝出套壳大瓜

XM外汇报导：

也就是说，这位Mistral离职的女员工，不仅在小作文中曝光了自己和前男友、Mistral同事的感情纠葛，还爆出Mistral套壳DeepSeek的丑闻。

容易被误解的是，

这个消息一曝光，立马在全网引起了轩然大波。

其实，

DeepMind研究员Susan Zhang转发并评论，直接点名Mistral AI的不道德行为。

在「小作文」里，这位Mistral前员工痛诉自己如何接连遭遇上司排挤、伴侣出轨、求职无望，还要靠抗抑郁药物试图让情感生活重回正轨。

简要回顾一下，

关键节点在2025年4月初， Mistral把她解雇了，原因在于工作分歧：

更重要的是，

她明确反对通过蒸馏DeepSeek来误导终端。

简要回顾一下，

这加剧了她对Mistral高层的不满——而她的伴侣又和高层关系密切。

需要注意的是，

在职业前途未卜、经济压力加剧、感情关系又充满不确定的三重打击下，她启动崩溃。

事实上，

这让DeepMind研究科学家Andreas Kirsch非常同情。🙏

Mistral的「秘方」竟是DeepSeek，这一事实让人无语。

火眼金睛博主

总的来说，

早发现Mistral蒸&# XM外汇官网 8203;馏DeepSeek

通常情况下，

其实早在今年6月，就有一位火眼金睛的AI行内人发现，Mistral Small 3.2写的东西，它怎么这么像DeepSeek呢！

概括一下，

这位名为Sam Paech的行内人，同时还是EQ-Bench基准的维护者，可谓十分有眼光。

为了比较Mistral-small-3.2和DeepSeek-v3之间的相似性，这位博主在模型的创意写作输出中，提取了跟人类基线相比最过度呈现的单词和n-gram词组。

事实上，

通过对这些词/n-gram中的前几百个数据特征进行层次聚类，生成了一张如下的相似性图。

肉眼可见，Mistral-small-3.2和DeepSeek-v3在谱系图中的位置非常接近，从而表明它们的特征是极其相似的。

换个角度来看，

这个过程中，他利用了一个生物信息学插件，基于slop特征谱的相似性，推断出了谱系树。

XM外汇资讯：

Susan Zhang对此直接表示，Mistral这身皮被扒下来，原来是DeepSeek啊！

综上所述，

甚至还有人发现，连Gemini Pro 2.5都和DeepSeek-R1之间有非常相似的感觉。

比如DeepSeek-R1非常擅长在对话中保持角色的一致性，而Gemini Pro 2.5也是如此，简直惊人的相似。

XM外汇消息：

蒸馏不是错

HuggingFace联合创始人兼首席执行官表示，蒸馏开源模型有错吗？

XM外汇消息：

毕竟，开源的意义之一就是让大家「自由利用」源代码，因此DeepSeek并不会禁止蒸馏。

换个角度来看，

而且蒸馏大模型也不不多变，DeepSeek蒸馏自己的R1模型就不太成功。Paech本人也表示，其实蒸馏也不算什么大错，现在很多模型都是这么干的。

大家常常忽略的是，

技术上，蒸馏是通过让小模型模仿大模型的输出结果来实现的。

请记住，

大模型会把自己的「经验」（比如语言模式、写作风格）以一种不多变的方法传给小模型。小模型通过大量练习，逐渐学会了类似的表现，但用更少的计算资源。

这种方法在AI领域很流行，考虑到这项技术很实用，比如能让大模型跑在手机或其他低性能设备上。

事实上，

蒸馏本身不是错，编造谎言才是难点的实质！

XM外汇行业评论：

说到头来，Mistral的难点不在于蒸馏DeepSeek，而在于把模型的进步归功于自家的RL方法，甚至蓄意改变基准测试。

有分析指出，

没有清楚标注模型是蒸馏的，缺乏透明度，才是最关键的难点。

XM外汇行业评论：

Mistral好像不止一次这么干，博士生Regi Kusumaatmadjia就发现Mistral的OCR模块与Mineru的OCR出奇的相似。

值得注意的是，

Mistral过去的高光时刻

其实，

想当初，Mistral可是深夜发一条磁力链接，就能让整个开源圈震撼的存在。

尽管如此，

在今年2月，才成立一年多的Mistral AI已经估值62亿美金，成为法国的骄傲，欧洲的骄傲。

然而，

欧洲的开发者们一度欢呼：恭喜Mistral AI，让欧洲在AI竞赛中终于有了一席之地。

Mistral AI的超级应用助手Le Chat，还一度登顶法国免费APP的榜首。

说到底，

马克龙一直以来也积极兼容Mistral，称其为：「法国人工智能产业的皇冠上瑰宝」。

2023年，这三位来自谷歌DeepMind、Meta的前员工希望打造一家遵循欧洲模式的AI公司——开源、高效、注重隐私。

很多人不知道，

随后，他们就用自己的方法，颠覆了硅谷的传统。

在当时，当OpenAI斥资超1亿美金训练GPT-4时，Mistral仅用2200万美元就打造出了最具竞争力的AI模型。

甚至马克龙还信誓旦旦表示，法国未来几年将投资1090亿欧元用于建设AI，尽最大努力为包括Mistral在内的公司创造空间。

综上所述，

在成立仅仅七个月的时间里，Mistral就在两个主要「权重级别」上发布了SOTA开源大语言模型（mistral-7b 和 mixtral）。

Mistral在底层架构持续取得突破（如sparse mixture-of-experts，稀疏专家混合架构）。

这对一家初创公司而言，成就非凡。

尽管如此，

刚刚，他们还推出了Mistral Medium 3.1，表示整体性能提升巨大。

尤其值得一提的是，

不过，这次推文底下质疑声不断。

谁都没想到，当初承载了多少人希望的Mistral，如今竟发展到了这一步。

可能你也遇到过，

参考资料：返回搜狐，查看更多

发表评论取消回复