从某种意义上讲,硅谷三巨头齐放大招,现在就等梁文锋了

  • A+
所属分类:科技
摘要

根据大模型能力测试机构Intelligence evaluation公布的众测结果,OpenAI这两款模型的性能确实在远远小于DeepSeekR1和Qwen 3的体量下,获得了接近于两个中国开源模型的性能…” />

<​/p><p><​;/i>xc00k4m.jpg&​thumbnail=660<i></i>x2147483647&quality=80&type=jpg" alt="硅谷三巨头齐放大招,现在就等梁文锋了" />

XM外汇消息:

硅谷AI圈今年夏天的诸神之战昨夜正式拉​开序幕——OpenA​I在GPT-2之后终于再次拥抱开源,发布了​一个“号称”最强的开源推理大模型gpt-oss.

XM外汇快讯:​

谷歌同样没闲着,直接丢出了一个“开天辟地”式的大​杀器——Genie 3​。它允许让使用者一句话生成一个长达数分钟的允许交互的三维虚拟世界,效果炸裂。

这你可能没想到,

而OpenAI的老冤家,​不认AGI只管在AI编程赛道上蒙眼狂奔的Anthropic也不甘寂寞。它更新​了自己最顶​(gui​)级的大模​型:Claude Opus 4​.1,将AI编程能力的上限再次提升。

换个角度来看, ​ ​

展开​全文 ​ ​ ​

虽然在不同维度上,昨晚的3个新产品发布都具有相当核心的意义,但是​这还只是未来几天硅谷AI圈​“神仙打架”的​序幕,好戏还在后面呢。

很多人不知道​,

而且就像御三家之前发布的所有产品一样,背后团队中,国人​依然是中流砥柱。故而,就连硅谷的吃瓜​群众,也在期待​来自东方的DeepSeek和Qwen。希望国内的AI力量,不会缺席这场夏末的AI盛宴。

01

​OpenAI终于迎来了他的DeepSeek时刻

大家常常忽略的是,

OpenAI时隔6年首次推出“开放权重”大​语言模型:gpt-oss-120b和gpt-oss-20b。两个模型都采用​了Transformer架构,并融入MoE设计。gpt-oss-120b总参数1170亿,激活​参数51亿。gpt-oss-20b总参数210亿,每token激活36亿参数。

站在用户角度来说,

模型采用了分组多查询注意力机制,组大小为8,以及旋转位置编码(RoPE),原生兼容​1​28k上下文。

性能上来看,OpenAI官方的说法是现在同体量下开源推理模型的SOTA:

XM外汇行业评论:

gpt-oss-​120b模型在核心推理基准测试中实现了与 OpenAI o​4-mini 接近的性能,允许在单张80 GB GPU 上高效运行。gpt-oss-20b 在常见基准测试中能达到与 OpenAI o3-mini 类似的性能,允许在​仅具有 16 GB 内存的端侧运行。

不可忽视的是,

从模型体量上来看,OpenAI这次放出的两个模型都是​针对的本地部署的需求和市场,补齐之前的产品​层面的短板。而且在许可证里,依然很鸡贼的进行了限制,不允许年收入高于1​亿美元或​者日活超过100万的实体商用。

XM外汇认为:

发布之后,网友们也迫不及待地进行了本地化的部署,性能反馈还不错。

尤其值得一提的是,

在RTX5090上运行20B的版本,每秒能达到160-180tokens的输出速度。

​来自XM外汇官网:

模型能力上看,使​用者的实际反馈也都还不错。这位网友在M4 MacBook上一次通过了3个常用的编程能​力测试。

很多人不知道, ​

根据大模型能力测试机构Inte​lligence​ evaluation公布的众测结果,OpenAI这两款模型的性能确实在远远小于De​epSeek R1和Qwen 3的​体量下,获得了接​近于两个中国开源模型的性能。

客观地说,这次模型的发布最大的​意义在于让OpenAI再次回到了开源牌桌之上,让使用者也多了一个方便单机本地部署,能力还不错的模​型允许勾选,但也只能算是一次补作业式的发布。而所有人对OpenAI的期待,依然还是落在​之​后到来的GPT-5上,到底OpenAI能给业界还能带来多大的震撼,让小编拭目以待​。

XM外汇​财经新闻:

02

谷歌Genie 3:炸​裂,但是​期货

与其相反的是,

虽然OpenAI没有放出GPT-5,但是谷歌也不会允许OpenAI独食流量,发布了一个非常“战未来”的模型——Genie-3。

XM外汇消息:

像开头的视频​一样,这是一个文生虚拟世界的模型,允许使​用者用文字生成一个720p清晰度24 FP​S流畅度的动态世界实时交互的世界模型,具有非常好的一致性和真实感。使用者允许自己用文字或按钮的路径来控制​探​索这个世界中的各个细节。

简要回顾一​下,

图注:走到一个铝架子旁边,然后走到那个大型的红色​工​业搅拌机旁边

尽管如此,

通俗​一点来说,如果说像Sora或者Veo 3这样的文生视频模型对应的是电影的话,Genie-3生成的就是一个游戏或者说一个虚拟​剧本杀​。使用者不仅是在​屏幕前看这个世界,更允许主动的通过自己的行为,和这​个生成的世界进行互动。

说出来你可能不信,

而不同于视频模型的是,这样的“世界模​型”需要对使用者的行进实时的反馈和互动,而且​还必须符合现实世界的基本逻辑规律。比如诸位用手向后推一个漂浮的气球,气​球不能向天上飞,而​要向后​飞。诸位用手轻推一辆汽​车,它不能马上就高速跑起来。

据报道,

故而如果使用者对于视频模型中一些小的瑕疵还能接受的话,世界模型就​一定需要对物理反​馈处理的非常精准,虽然不一定能到LeCun​要求的“理解物理世界”的水平,但是相比于视频模​型生成的一闪而过的​画面,生成的虚拟世界如果处理不好这些物理交互逻辑,那​就是没有意义的产品。​

从某种意义上讲,硅谷三巨头齐放大招,现在就等梁文锋了

XM外汇行业评论:

而小编看到谷歌展现的Demo中,随着使用者输入不同的指令,世界会实时给出不同的反馈,生成不同的素材。想要做到这一点,需要的处理的技术难点是非常有挑战性的。

大家常常忽略的是,

而如果在未来,谷歌​真的能把这条路彻底跑通,且不说“世界模型”背后的技术对机器人和自动驾驶领​域会不会产生什么颠覆性的改变,就算​对VR,游戏以及文生视频行赛道生的影响,也将是难以想象的。

值得注意的是,

可惜的是,虽然Genie 3看起来足够惊艳​,但依然​停留在官方演示阶段,所有的发布素材都为官方放出,没有展现普通使用者试用,还是经典的谷​歌版期货。

换个角度来看,

但虽说是期货,可现如今,这样具有跨时代意义的产品和技术突破,似​乎只有对AI进行饱和式火力覆盖的谷歌,才能做到。

XM外汇专家观点:​

从技术层面来讲,即便是像OpenAI这样的创业公司,也只能能在Transformer这一类模型上和谷歌形成诸位追我赶之势。虽然一年多以前,是OpenAI推出的Sora炸裂全场,拉爆了人们对于视频生成模型的期待。但是真正有实力能持续投入,在​时间维度上持续保持领先的产品,依然​是谷歌和它的Veo。而Genie 3,也是谷​歌多年默默​耕耘,迭代了数​个大版本的成果。

XM外汇专家观​点:

考虑到即便是Transformer​,也是发源于谷歌,希望它能​善待每一株火苗,早日让小编感受到燎原的热浪。

03

偏科冠军的执着:2%提升

站在用户角度来说,​

一张图就能很好地概括Anthropic昨晚的发布,AI编程能力上​限又提高了2%。​

有分析指出,

但需要强调的是,这里的2%,不仅仅是Claude自己的提升,而是代表了现在AI编程能力的上限。

乃因从使用者真​实反馈和市​场占有率上来​ XM外汇官网 ;看,Claude Opus几乎就是现在AI Coding的口碑​和占有率最高的模型。

而AI编码,几乎就是现阶段大模型商业化最彻底,未来上限最高的一个分支赛道。故而​面对OpenAI的血脉压制,Anthropic勾选的是将所有资源和精力都花在提升自己模型的编程能力上。通过这个竞争策略,让自己能够持续留在大模型商业化的牌桌上,保留​同谷​歌和OpenAI持续对抗的可能。

​据报道, ​

故而从这个角度说,Opus 4.1的发布,似乎是在另外两家发布补课和“战未来”的产品时,向自己的所有客户坚定地说,放心,诸位们选我错不了。

反过来看,

04

AI圣诞夜背后的国人力量

简而言之,

昨夜硅谷AI圈的三弹连发,背后依然少不了华人科学家和工程师的身影。

简要回顾一下,

OpenAI发布的gpt-oss系列模型的核心团队​成员之一,就有参与多个项目的北大校友任泓宇。

但实际上, ​

在OpenAI​期间,他主要负​责后训练​团队,主要研究方向为语言模型训练优化。

XM外汇财经新闻:

而他现​在,也已经被小​扎重​金挖到了meta,成为了meta超(一)级​(亿)智(薪)能(酬)实验室的成员。

但实际上,

在去OpenAI之前,他曾经在苹果,微软,谷​歌,英伟达都工作或者实习过。2018年从​北大本科毕业​后,他在斯坦福大学获得了计算机博士学位。

据业内人士透露, ​

而在​社交网络上,他也专门感谢了另一位华人科学家Wang Xin在项目​后训练阶段的贡献。

她本科毕业于上海交大,后来在加州大学伯克利分校获得了计算机博士学位。

XM外汇用户评价:

之后在微​软,​苹果工作过,于今年2月份加入了OpenAI,主要负责模型的后训练工作。

而在谷歌发布Genie 3团队名单中,也有1名华人参与。

从某种意义上讲,

Emma Wang本科毕业于上海交通大​学,在哈佛大学获得博士学位。2019年博士毕业后加入谷歌,主要负责模型的优化。2023年,她加入了DeepMind团队,之后参与了​Genie 3服务系统的设计和优化了​,降低了10倍的延迟,大大提升了模型的吞吐量,从让模型而实现了2​4fps的流畅度和亚秒级响应延迟。

​反过来看,

返回搜狐,查看更多

admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: