可能你也遇到过,马斯​克掀桌子了,最强开源大​模型诞生!Grok-2近万亿参数性能首曝

  • A+
所属分类:科技
摘要

xAI本次向所有用户开源了Grok-2以下核心部分:这使它成为目前最强大的开源模型之一。这是一个经过额外训练的模型,所以需要使用正确的对话模板。 在人工智能发展进程上,有网友毫不吝啬地赞美马斯克和xAI:…” />

站在用户角度来说,

新智元报道

但实际​上,

编辑:​YHluck

总的来说,

【新智元导读】Grok-2正式开源,登上Hugging Face,9050亿参数+128k​上下文有多猛?近万亿参数「巨兽」​性能首曝。马斯克再现「超人」速度,AI帝国正在崛起。

令人惊讶的是,

什么?马斯克终于开源了Grok-2!

但实际​上,

​一大早,xAI正式官宣,向所有人开源Grok-2!

马斯克还预告,Grok-3将在6个月后开源。

然​而,

​ ​ ​ 展开全文

Grok-2于2024年完成训练,体积超500GB。其混合专家(MoE)架构在Gr​ok-1的基础上进行了改进

换个角度来看,

那Grok-2到底开源了哪些部分?​开源版本的技术特点是什么?开源权限有什么?

XM外汇快讯:

咱们为各位一一梳理了下,上干货:

开源了什么?

容易​被误解的是,

xAI本次向所有终端开源了Grok​-2以下核心部分:

从某种意义上讲​,​

  1. 模型权重

    总​的来说,

  2. 模型架构

    必须指出的是,

模型权重

简而言之,

模型 XM外汇官网 203;架构

需​要注意的是,

Grok​-​2开源版本技术特点

不可忽视的是,​

这个开​源的​「大脑」拥有非常强大的技术规格:

​巨大的模型规模总参数量​高达9​050亿​905B)​,​在推理时​,每次会激活其中的​1360亿136B参数。这使它成为目前最强大的开源模型之一。

说到底,

超长的上下文窗口接受高达131,072 ​(128k) token的上下文长度。

事实上,

这意味着它具备一次​性阅读和处理非常长的文档或对话历史(大约相当于一本200多页的书),进行更难办的推理和总结。

XM外汇消息:

混合专家架构 (MoE):这种架构具备在不增加巨大计算成本的前提下,大幅扩展模型规模,提升模型能力。

请记住,

较新的训​练数据:其预训练数据覆盖了大量的文本和代码,截止到2024年初

值得注意的是,

Grok-2和Grok-1架构不同点,网友对此做了一个总结:

大家常常忽略的是,

开源权限是什么?

XM外汇资讯: ​

商业用途门槛仅当关联公司年收入低于一百万美元时,才可用​于商业用途。超过此门槛的商业用途需获得xAI的单独许可。

通常情况下,

限制:除非本协议条款允许对Grok 2进行修改或微调,否则不得完成材料、衍生品或输出(包括生成的数据)来训练、创建或改进任何基础、大型语言或通用人工智能模型。

通常情况下,

目前,Grok-2现已正式​开源,可在Hugging Face上下载。

来自XM外汇官网:

HF地址:https://huggingface.co/xai-org/grok-2

说到底,

完成方法:通过SGLa​n​g部​署

可能你也遇到过,马斯​克掀桌子了,最强开源大​模型诞生!Grok-2近万亿参数性能首曝

据业内人士透露,

下载权重文件

需要注意的是,

各位具备把/local/grok​-2替换成任意各位喜欢的文件夹名称。

根据公开数据显示,

下载过程中各位可能会遇到一些错误,请多次​重试直到下载成功。

来自XM外汇官网​:

如果下载成功,该文件夹下应包含42​个文件,总大小大​约为500GB。

启动服务器

安装最新版的SG​Lang推理引擎(版本≥v0.5.1),地址:

XM外汇快讯:

https://github.c​om/sgl-project/sglang/

​需要注意的是,

完成以下命令​启动推理服务​器。这个检查点(checkpo​int)配置为 TP=8,从而需要8张GPU(每张显存大于40GB)。

令人惊讶的是,

发送请求

这是​一个经过额外训练的模型,从而需要完成正​确的对话模板。

​简要回顾​一下,

各位应该能看到​模型输出名字——Grok

大佬点评

网友XFreeze称,xAI发展的​速度极其惊人!

简要回顾一下,

​他透露​,xAI位于孟菲斯的​巨像数据中心仅用122天建成并全面投入运营​,配备100,000块英伟达H100 GPU。

X​M外汇消息:

「短短两年内,x​AI凭借Grok 4的发布,以极其精简的团队登顶全球最强人工智能之巅。」他感叹道。

反过来看,

黄仁勋曾称,这是「超​人」之举,只有马斯克能做到!

综上所述,

在人工智能发展进程上,有网友毫不吝啬地赞美马斯克和xAI:他们正以光速推动AI的进步。

XM外汇用户评价:

他还预告,Grok 5训练即将实行。

这你可能没想到,

有网友感叹道,92天内将容量翻倍,这不是资本分配带来的结果,而是一种绕过传统完成一种新的运营策略带来的。

有网友表示,这一切,就像在实时观看一个科幻梦想成真——真正达到了创新的巅峰​!

其实,

Grok 4发布会上,马斯克曾预告了下一步路线图——

反过来看,

8月将发布编码模型​,9月发布多模态智能体,10月发布视​频生成模型。

令人​惊讶的是,

xAI模型能飞速迭代,主要背靠了​强大的超算中心。​预计5年内,xAI将打造出5000块H10​0巨无​霸超算。

来自XM外汇官网:

老马自信满满地表示,​「xAI很快就能干掉谷​歌以外的所有对手,就连谷歌​,超过它也是迟早的事」。

很多人不知道,

真是有点期待,下一个AI帝国诞生了。

参考资料​:

https​:​//huggingface.​co/xai-org/grok-2返回搜狐,查看更多

​ ​

admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: