令人惊讶的是，DeepSeek官宣R1升级：提升思维深度与推理能力，整体表现已接近国际顶尖模型

发表评论

A+

所属分类：科技

摘要

更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如o3与Gemini-2.5-Pro。此次 R1更新后，官方网站、小程…” />

简要回顾一下，

国产大模型公司深度求索（DeepSeek）发布详细的升级公告，解释DeepSeek-R1升级的具体情况。

5月29日，据DeepSeek公告，DeepSeek R1模型已完成小版本升级，当前版本为DeepSeek-R1-0528。终端通过官方网站、APP或小程序进入对话视图后，开启“深度思考”用途即可体验最新版本。API也已同步更新，调用方法不变。

公告指出，DeepSeek-R1-0528利用2024年12月所发布的DeepSeek V3 Base模型作为基座，但在后训练过程中投入了更多算力，显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如o3与Gemini-2.5-Pro。

相较于旧版R1，新版模型在难办推理任务中的表现有显著提升。例如在AIME2025测试中，新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强：在AIME2025测试集上，旧版模型平均每题利用12K tokens，而新版模型平均每题利用23Ktokens，表明其在解题过程中进行了更为详尽和深入的思考。< XM外汇代理 /p>

DeepSeek表示，DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有核心意义。

新版DeepSeek R1针对“幻觉”疑问进行了优化。与旧版相比，更新后的模型在改写润色、总结摘要、阅读理解等场景中，幻觉率降低45-50%左右，能够有效地供给更为准确、可靠的结果。

在旧版R1的基础上，更新后的R1模型针对议论文、小说、散文等文体进行进一步优化，能够输出篇幅更长、结构素材更完整的长篇作品，同时呈现出更加贴近人类偏好的写作风格。

据公告称，当前模型的测评成绩与OpenAI o1-high相当，但与o3-High以及Claude4 Sonnet仍有差距。

此次 R1更新后，官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果终端对更长的上下文长度有需求，适配通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。与旧版本的DeepSeek-R1保持一致，此次升级仍为开源模型，允许终端利用模型输出、通过模型蒸馏等方法训练其他模型。

此前5月28日，DeepSeek在官方微信群发布消息称，DeepSeekR1模型已完成“小版本试升级”，欢迎前往官方网页、APP、小程序测试（打开深度思考），API接口和利用方法保持不变。

据网友测评显示，此次升级效果令人惊艳。从社交媒体的反馈来看，网友最为关注的是此次DeepSeekR1更新后的思考时间变长。据测评显示，此次DeepSeek单任务处理时长可达30-60分钟。返回搜狐，查看更多