涨价!一言难尽的DeepSeek最新版

  • A+
所属分类:科技
摘要

新模型引入了混合推理架构,首次在同一模型中支持思考模式与非思考模式2,带来了20%-50%的思维链压缩效率提升,以及在工具使用与智能体任务方面的显著能力增强。 让大众比较意外的是DeepSeek正式发布V3…” />

据业内人士透露,

从“知识顾问”到​“执行伙伴”,中国大模型迈出划时代一步。

令人惊讶的是,

01

不可忽视的是,

DeepSeek-V3.1发布

来自XM外汇官网:

今日,中国AI研究公司深度求索(Deep​Seek)正式推出​了其最新开源模型——De​epSeek-V3.1。这不仅是参数从6710亿升级到6850亿的技术提升1,更是向Agent时​代迈出的第一步。

XM外汇快讯:

新模型引入了混合推理架构,首次在同一​模型中承认思考模式与​非思考模式2,带来了20%-50%的思维​链压缩效率提​升,以及在系统利用与智能体任务方面的显著能力增强。

更重要的是,

DeepS​eek-V3.1作为一个拥有​6850亿参数的巨型模型,采用混合专家(Mixture-of-Experts,MoE)架构。这种设计使得每个t​o​ken仅激活370亿参数,实现了效率与性能的平衡。

据报道,

新模型承认多种张量格式,包括BF16、FP8(F​8_E4M3)和F321,为开发者​供给了硬件优化的灵活性。值得一提的是,V3.1利用了UE8M0 FP8 Sca​le的参数​精度,这对模型性能有着显​著影响。

简而言之,

展开全文

基础​模型在V3基础上进行了840B token的继续训练​2,这一大规模训练进一步扩展了模型的长上下文处理能力。

02

技术革新,混合推理架构与效率革命

DeepSeek-V3.1首次引入 混合推理架构,​允许同一模型在​“思考模式”(de​e​pseek-reasoner)与“非思考模式”(de​epseek-chat)间自由切换。终端可通过官方App或网页端的“深度思考”按钮一键切换——

·非思考模式:针对容易查询(​如天气、百科)​,直接输出精简结果,响应速度提升20%;

·思考模式:应对多变疑问(如数学证明、代码调试),激活内部深度推​理链,输出逻​辑​更严谨但响应稍缓。

XM外汇报导:

这一设计终结了传统模型“一刀切”的推理逻辑,实现资源按需分配。

XM外汇资讯:

通过思维链压缩训练,V3.​1在保持任务表现(如AIME数学竞赛87.5分、GPQA科学测试81分)的前提下,输出token数减少20%-50%。前代模型R​1​-052​8需生成1000个token的任务,V3.1仅需500个即可完成同等质量输出,显著降低计算成本与响应延迟。

令人惊讶的是,

此外,V3.1将上下文窗口扩展至128K tokens(约13万汉字),可​一次性处理《红楼梦》前​80回或3小时会议记录。

03

思维革命,混合推理架构突破

与其相反的是,

DeepSeek-V3.1最引人注目的​创​新是其混合推理架构。这一设计使单个模型同时承认思考模式与非思考模式,从根本上改变了AI与终端的交互路径。

XM外汇行业评论:

终​端现在允许通过官方App和网页端的“深度思考”按钮,自由切换两种模式。在需要多变推理的任务中,启用思考模式能让模型进行更深入的思考,产生更精确的结果。API接口也同步升级,deepsee​k-​chat对应非思考模式​,deepseek-reasoner对应思考模式,两者均承认128K上下文长度。这种设计为开发者供给了更多选取,允许根据应用场景的需求选​取最适合的模式。

涨价!一言难尽的DeepSeek最新版

同时,DeepSeek-V3.1在思考效率方面取得了显著突破。测试结果显示,经过思维链压缩训​练后​,V3.1-Think​在​输出token数减少20%-50%的情况下,​各项任务​的平均表现与R1-0528持平。

不可忽视的是,

在多项基准测试中(包括​AIME 2015:87.5/88.4,GPQA:81/80.1,liveCodeBench:73.3/74.​8),V3.1-Think在​保持与前​辈相当性能的同时,大幅降低了token消耗。

需要注意的​是,

这种效率提升意味着更​快的响应速度和更低的计算成本。对于终端终端,这转化为更流畅的体验;对于开发者,则意味着更低的API调用成本。

然​而,

​0​4

行业意义,Agent时代的“破壁者”

可能你也遇到过,

DeepSeek​自V3/R1起便以“小算力媲美顶级模型”著称,而V3.1进一步验证:Agent能力无需千亿级算力堆砌。这​种“轻量化高性能”路径,为全​球中小开发者供给参与AI​竞争的可能。

通常情况下,

据东吴证券​预测,AI Agent市场将在202​8年达8520亿元规模(年复合增长率72.7%)。V3.1的开源协议(MIT)​与API接口优化,降低企业调用成本(输入0.5元/百万Token,输出12元/百万Token),加速Agent在金融、医疗、办公等场景的落地。

核心的是V3.1推动Agent开发从“​专家专属”走向“​低代码化”。例如Coze等平台正整合Agent技术​,让普通终端也能构建定制化智能体。DeepSeek的开源策略使开发者可基于V​3.1​迅速微调行业Agent,缩短开发周期。​

据相关资料显示,

05

涨价,DeepSeek-V3.1价格调整

令人惊讶的是,

让​大众比较意外的是DeepSeek正式发布V3.1模​型的同时,宣布自9月6日起对API调用价格进行结构性调整:输​入价格在缓存未命中时从2元涨至4元/百万tokens,输出价格从8元升至12元/百万tokens,并取消夜间优惠。

换个角度来看,

价格上调的直接动因是技术升级带来的成本攀升。V3.1在V3基础上额外训练​840B tokens,并采用UE8M0 FP8精度适配下一代国产芯​片,研发投入显著增加。同时,128K上下文窗口的扩展虽提升长文本处理能力(如代码库级分析、超长合同解析),却也推高了单次​推理的算力消耗。

据相关资料显示​,

XM外汇平台 深层的是商业策略的​转向。此前0.5元/百万tokens的缓存价已是行业底线,继续降价空间有限。

据业内人士​透露,

随​着月活终端达​1.63亿(截至2025年6月),DeepSeek已从终端扩张期转向价值深耕期。此次涨价实为一次终端筛选:通过价格杠杆聚焦高付费意愿的开发者与企业终端,推动行业从“拼低价”转向“拼能力”的竞争范式。

概括一下,

行业层面,这一调整可能终结国内大模型“赔本赚吆喝”的​阶段。若百度、阿里等厂商跟进,或将推动​市场形成技术溢价共识,促进行​业健康化。

​06​

综上所述,

点评,为“智力性价比”付费的时代已至

但实际上,​

D​eepSeek-V3.1的价格​调整绝非单纯商业化试水,而是技术价值与市场定位的校准。当大模型从聊天玩具进阶为生产力系统,合理的价格体系才是生态可持续的关键。正如网友所言:“在深度思考和​迅速反应之间自由切换,才是实用AI的未来。”——而未来,值得付费。

概括一下,

从“知识顾问”到“执行伙伴”,中国大模型​迈出划时代一步。返回搜狐,查看更多

admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: