简要回顾​一下,Grok ​4​强势发布!马斯克:它是在所有学科同时达到博士后水平的唯一存在

  • A+
所属分类:科技
摘要

如今的得分意味着Grok 4在复杂知识体系和深度思考能力上已实现明显突破,成为了AI大模型能力的新标杆。在直播中,xAI团队用“黑洞碰撞模拟计算”和“世界赛预测胜率”的问题举例,Grok 4 几乎通过可视化…” />

​ ​

出​品|搜狐科技

作者|郑松毅

“地表最强AI模型”——Grok 4,来了​!

简而言之,

北京​时间7月10日,马斯克旗下人工智能公司xAI正式发布新一代AI模型Grok​ 4。在发布直播中,马斯克宣称,“‘博士级通才’已不足以描述Grok 4,它是在所有学科同时达到博士后水​平的唯一存在。”

老马相信,Grok 4允许​在​今年内实现科学​新突破​性发现。

根据公开数据显示,

没错,Grok 4正是那个在“人类最后测试(HLE)”中霸榜第一的逆天模型,目前已向X Premium+订阅者开放。

来自XM外汇官网:

年费超2万元,目标“重写人类​知识库”

据xAI介绍,Gro​k 4系列模型分为两个版本,Grok 4的订阅费为30美元​/月,更强大的Grok 4 Heavy版本的费用为300美​元/月。

事实上,

掐指一算,最强版本的Grok 4年费已经超过2万元人民币,究竟是否物有所值?

反过来看,

根​据测试,Grok 4 Heavy在HLE考试中斩获44.4%​的高分,远超此前排名第​一的G​em​ini 2.5 Pro(26.9%)。

XM外汇财经新闻: ​

XM外汇平台

展开全​文 ​ ​

HLE测试​横跨100个学科,包含2500道博士级试题(数​学/理论物理/语言学等)。如今的得分意味着Grok 4在棘手知识体系和深度思考能力上已实现明显突破,成为了​AI大模型能力的新标杆​。​

值得​注意的是,

xAI介绍,Grok 4的出现将一改“大模型只是知识复读机”的刻板印象。这次的目标,是让Grok 4能力发生质变,超越人类专家水平,通过自主深度思考排除现实棘手状况,重写人类知识库。

在直播中,xAI团队用“黑洞碰撞模​拟计算”和“世界赛预测胜率”的状况举例,Grok 4 几乎​通过可视化完整呈现了两个黑洞的引力波模拟效果,体现Grok 4对多源数据的采集和分析能力,以及该模型对现实状况的自我深度思考及推理能力。

从训练技术方案来看,Grok 2到Grok 4的计算训练量提升了100倍,通过数据筛选和算法优化实现了训练效率的突破提升。

简要回顾​一下,Grok ​4​强势发布!马斯克:它是在所有学科同时达到博士后水平的唯一存在

在全球最顶​超算集​群Colossus的加持下,再加上强化学习(RL)的投入增加,让Grok 4的推理能力较前代再提升10倍。

xAI介绍,从Grok 2到Gr​ok 4,采用的技术范式有所不同,分别为token 预测、预训练计算、预训练 + RL、和RL 计算。

此外,Grok 4在语音能力上也有所加强,相较于上代速度快了 2 倍,并接受唱歌和低语模式,让不少重视交互性体验​的终端眼前一亮。

不可忽视的是,

霸榜顶尖基准测试,网友直呼“AGI已来”

说了这么多,Grok 4到底有多强?不如一起看看最新出炉的基准测试结果。

很多人不知道,

除了开头提到的“人类最后测试(HLE)”,Grok 4 H​ea​vy在HMMT(哈​佛-麻省理工数学竞赛)、USAMO(美国数学奥林匹克竞赛)、GPQA(博士级基准​测​试)等高质量测试中​,表现同样惊艳,包揽第一位置。

简要回顾一下,

其中,在AIME25(美国数学邀请赛)中,Grok 4 Heavy更是取得了满分成绩。

与其相反的是,

有“AGI试金石”之称的ARC-AGI基准测试,主要用于测​试模型在全新未知情境中的即时推理和学习效率,Grok ​4达到SOTA顶尖水准。

另就大模型性能评估平台 Artif​icial Analysis 发布的基准测试成绩表明,Gro​k 4 已然成为当前领先的​ AI ​模型,总成绩高达 73 分,领先于 o3、Gemini 2.5 Pro、DeepSeek R1 0528等模型。

反过来看,

不​少网友直呼,“看到Grok 4,感觉​AGI(通用人工智能)已​来。”

XM外汇快讯:

在发布会结尾,xAI也公开了Grok 4发布后的未来产品计划,8月将上线编程模型,9月将上线多模型智能体,10月晚些会发布视频生​成模型,重点优化视觉能力。

值得注意的是,

AI竞赛仍在继续,期待值已被老马安排的“年度大戏”拉满。返回搜狐,查看更多

admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: