总的来说，谷歌成为IMO金牌首个AI得主，前5题满分但难解最后一题，专家称缺乏创造力，难替代人类数学家

发表评论

A+

所属分类：科技

摘要

数小时前，经国际数学奥林匹克竞赛（IMO）组织官方认证，谷歌DeepMind正式成为全球首个摘得IMO金牌的AI选手，表现一度令人震惊。在去年的IMO竞赛中，谷歌DeepMind的AlphaProof和A…” />

XM外汇用户评价：

出品｜搜狐科技

作者｜郑松毅

与其相反的是，

编辑｜杨锦

数小时前，经国际数学奥林匹克竞赛（IMO）组织官方认证，谷歌DeepMind正式成为全球首个摘得IMO金牌的AI选手，表现一度令人震惊。

很多人不知道，

斩获今年金牌的是Gemini模型的一个“特调”版本——Gemini Deep Think，具备更强的推理思考能力，后期会开放给Google AI Ultra订阅终端（月付1800元的氪金玩家）。

经IMO评审组评分，Gemini Deep Think答对了IMO六道题目中的五道，获得35分（总分42分），达到金牌水准。

可能你也遇到过，

得知喜讯，谷歌CEO劈柴立发贺电，马斯克也发布推文表示祝贺。

站在用户角度来说，

相较于前几日赛事揭榜前就着急宣传自己得金，后来被发现并非官方认证、饱受质疑的OpenAI来说，谷歌低调摘金的完成，让其属实有些难堪。

通常情况下，

果然，有实力的选手都习惯于低调做事，再用成绩亮拳。

XM外汇财经新闻：

首获奥赛金牌的AI选手

自1959年起，每年一度的国际数学奥林匹克竞赛（IMO）在国际上负有盛名，参赛选手代表着世界上一群最具天赋的年轻计算人才，在超高难度的代数、几何学、数论等领域激烈角逐。

但实际上，

根据参赛规定，选手需在4.5小时内化解六道极具难度的数学难点，每题7分，总分42分。

XM外汇资讯：

今年，IMO金牌线设定为35分，银线为28分。在所有参赛选手中，只有排名前8%的选手才可荣获金牌。这象征着数学领域的绝对荣耀。

从某种意义上讲，

展开全文

近年来，有“数学试金石”之称的IMO，已逐渐成为一项AI向往的挑战，旨在考验AI严谨的逻辑思维能力、推理能力，以及创造性思维能力，对AI模型提出了极高要求。

说出来你可能不信，

在去年的IMO竞赛中，谷歌DeepMind的AlphaProof和AlphaGeometry 2合力化解了六道难题中的四道，以28分的成绩摘得银牌。

综上所述，

但之前化解六道竞赛难点花了整整三天，乃因需要执行把难点从自然语言翻译成领域特定语言（例如 Lean）的棘手操作路径，再加上推理验证所需时间漫长，结果让人等得着急。

XM外汇报导：

而今年的新模型Gemini Deep Think的表现有了突破性进步，主要体现在化解棘手难点的效率和准确度上。

令人惊讶的是，

Gemini Deep Think答题全程自然语言，不必再特意修改题目格式，节约了一大笔时间成本。

必须指出的是，

据介绍， XM外汇官网 Gemini Deep Think是一种针对棘手难点的增强型推理模式，融合了谷歌最新的一些研究技术，包括“并行思维”。使模型能够同时探索并组合多种可能的化解方案，最终得出答案，而不是追求单一的线性思维链。

此外，DeepMind还为Gemini精选了高质量数学题库，并在其指令中添加了关于如何解答IMO题目的技巧指引。

有分析指出，

从成绩来看，本次Gemini不仅在4.5小时内高效交卷，还取得了前五道题满分的傲人成绩。

至于没答出的最后一题，DeepMind研究院、布朗大学教授Junehyuk Jung解释，“一实行解题方向出现了错误，不过人类选手做对最后一道的也只有五人。”

AI或替代人类数学家？

事实上，

在Google DeepMind官网，可用看到Gemini Deep Think做对的五道题答案已完整公开。

更重要的是，

对今年Gemini的竞赛表现，IMO主席Gregor Dolinar教授亲自认证，“解法在诸多方面堪称惊艳，这些解法思路清晰、表达准确，且大部分数据都便捷易懂。”

XM外汇快讯：

Junehyuk表示认同，“用第三道题举例来说，很多人的解法挑选采纳的是棘手高深的研究生水平方案，但Gemini仅采纳了初等数论知识就完成了解答证明。”

不妨想一想，

在谷歌DeepMind团队看来，AI为数学作出的贡献潜力才刚崭露头角。团队坚信，具备严谨思考和推理能力的AI智能体，将成为数学家、科学家不可或缺的程序。

作为菲尔兹奖、数学突破奖、麦克阿瑟奖等多个奖项的获得者，数学家陶哲轩对Gemini的表现同样表示称赞。

很多人不知道，

陶哲轩提到，“AI正在推动数学研究范式的转变。在不久的将来（可能是2026年），AI 将能够与人类数学家合作发表研究级别的论文。这种合作模式将彻底改变数学的协作路径，使得大规模、分布式的数学实验成为可能。”

AI在IMO中摘金展现出强大实力，不少人疑惑数学家会不会被AI取代？

反过来看，

UCLA应用数学教授Ernest Ryu表示，“短期内，AI并不能取代数学家。”

从某种意义上讲，

他认为，“数学研究的本质是，化解那些目前没有人知道如何化解的难点（训练数据之外），类似竞赛中的第六道题，这需要极大的创造力。显然，这次AI的表现描述还不具备这种能力。”

“对于人类已有能力化解的数学难点，数学研究的工作是为了将现有技巧和新创意相结合，从而衍生出优化解法，AI在这部分工作中将起到主要提效作用。”

XM外汇行业评论：

IMO成中国vs美国vs人工智能的竞争

这你可能没想到，

值得一提的是，在最终揭榜的人类选手成绩单中，中国队以全员6金牌、总分231分占据榜首，继去年遗憾败给美国队后，重新坐回了世界第一位置。

中国队的六位选手分别是来自武昌实验中学的邓哲文、武汉市经开外国语高级中学的徐祺铭和谈弘毅、重庆巴蜀中学的张恒烨、杭州学军中学的董镇宇，以及上海中学的邓乐言。

在去年的第65届IMO中，还是武昌实验中学的高一学生邓哲文就为中国队斩获了一枚金牌。

据业内人士透露，

主教练介绍，“邓哲文学习数学的天赋很高，在竞赛学习过程中，表现出了纯粹的热爱和执着的钻研精神。”

通常情况下，

张恒烨是巴蜀中学高二学生，2023年入选国家集训队，在24年阿里全球数赛中获得优秀奖。

据报道，

如今高三的董镇宇，在高一时就入选了国家集训队，保送到清华姚班，在数学竞赛圈内已是颇有名气。

XM外汇资讯：

其中，谈弘毅和徐祺铭同来自于武汉经开的强基班。前者获得了清华和北大的保送资格，后者成功入选了北京大学2025年数学英才班。

而邓乐言作为团队中年纪最小的一位，在去年CMO以满分成绩入选国家集训队，并在集训中脱颖而出，直接打破了上海近十年IMO选拔的年龄纪录。人送外号“新韦神”。

尤其值得一提的是，

从本届IMO排名前30的选手名单来看，来自亚洲和东欧的英才占比居高。

通常情况下，

有评论玩笑道，“自此之后，IMO将是中国vs美国vs人工智能的竞争。”返回搜狐，查看更多

发表评论取消回复