这你可能没想到，OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

发表评论

A+

所属分类：科技

摘要

背后原因，可能是他们最近的新发现：评测在奖励模型「幻觉」，模型被逼成「应试选手」。与此同时，OpenAI还非常罕见地发了一篇论文揭秘——让AI产生「幻觉」的罪魁祸首，就是我们自己！在积累了成千上万道题后，…” />

请记住，

来源：市场资讯

有分析指出，

（来源：新智元）

XM外汇认为：

新智元报道

XM外汇专家观点：

编辑：KingHZ 好困

【新智元导读】OpenAI重磅结构调整：ChatGPT「模型行为」团队并入Post-Training，前负责人Joanne Jang负责新成立的OAI Labs。而背后原因，可能是他们最近的新发现：评测在奖励模型「幻觉」，模型被逼成「应试选手」。一次组织重组+评测范式重构，也许正在改写AI的能力边界与产品形态。

说到底，

就在刚刚，OpenAI决定——重组ChatGPT「个性」研究团队！

XM外汇财经新闻：

这个约14人的小组，规模虽小但责任重大——他们要负责让GPT模型知道该怎么和人类进行交互。

换个角度来看，

根据内部消息，模型行为团队（Model Behavior team）将直接并入后训练团队（Post-Training team），并向后训练负责人Max Schwarzer汇报。

XM外汇消息：

展开全文

团队前负责人Joanne Jang，从头展开新的实验室「OAI Labs」——为人类与AI的协作模式，发明并构建新的交互视图原型。

需要注意的是，

与此同时，OpenAI还非常罕见地发了一篇论文揭秘——让AI产生「幻觉」的罪魁祸首，就是咱们自己！

来自XM外汇官网：

整个行业为了追求高分排行榜而设计的「应试」评估体系，迫使AI宁愿去猜测答案，也不愿诚实地说出「我不知道」。

XM外汇快讯：

论文地址：https://openai.com/index/why-language-models-hallucinate/

根据公开数据显示，

超现实的一天

尽管如此，

模型行为团队几乎参与了GPT-4后的全部模型研发，包括GPT-4o、GPT-4.5以及GPT-5。

XM外汇行业评论：

上周，作为Model Behavior团队负责人的Joanne Jang，登上《时代》百大AI人物榜单的「思想家」（Time AI 100 Thinkers），超越图灵奖得主、深度学习三巨头之一的Yoshua Bengio、谷歌首席科学家Jeffrey Dean等大佬。

其实，

就在同一天，OpenAI决定将她从团队调离，自己去负责一个新的方向。

XM外汇消息：

对她而言，那天的确是「超现实」

Joanne Jang认为，她的工作核心在于「赋能终端去实现他们的目标」，但前提是 XM外汇平台不能造成伤害或侵犯他人的自由。

她直言：AI实验室的员工不应该成为决定人们能创造什么、不能创造什么的仲裁者

开启新征程：瞄准下一代AI交互

刚刚，Joanne Jang发文表示她已有新的工作职位：发明和原型化全新的交互视图，探索人与AI协作的未来模式。

她将从头展开负责新的OAI Labs实验室：一个以研究为驱动的团队，致力于为人类与AI的协作模式，发明和构建新视图的原型。

有分析指出，

借此平台，她将探索超越聊天、甚至超越智能体的新模式——迈向能够用于思考、创造、娱乐、学习、连接与实践的全新范式与程序。

事实上，

这让她无比兴奋，也是过去四年在OpenAI她最享受的工作：

把前沿能力转化为面向世界的产品，并与才华横溢的同事们一起打磨落地。

从DALL·E 2、标准语音模式，到GPT-4与模型行为，她在OpenAI的工作涵盖不同的个性化与交互模式。

不妨想一想，

她学到了很多，体会深刻：

简而言之，

塑造一个视图，是多么能够激发人们去突破想象的边界。

XM外汇消息：

在接受采访时，她坦言，现在还在早期阶段，究竟会探索出哪些全新的交互视图，还没有明确答案。

值得注意的是，

我非常兴奋能去探索一些能突破「聊天」范式的模式。聊天目前更多与陪伴相关；而「智能体」则强调自主性。

简而言之，

但我更愿意把AI系统视为思考、创造、游戏、实践、学习和连接的程序。

OpenAI的模型行为研究员，负责设计和开发评测体系（evals），横跨多个环节：

来自XM外汇官网：

对齐（alignment）、训练、数据、强化学习（RL）以及后训练（post-training）等。

来自XM外汇官网：

除了研究本身，模型行为研究员还需要具备对产品的敏锐直觉，以及对经典AI对齐疑问的深刻理解。

据相关资料显示，

OpenAI对模型行为研究员的经验要求

反过来看，

在之前的招聘中，OpenAI称：模型即产品，而评测体系就是模型的灵魂。

令人惊讶的是，

但OpenAI最新发布的研究显示：评测体系从根本上决定了模型。

然而，

在论文中，研究人员得出结论：

大家常常忽略的是，

实际上，大多数主流评测在奖励幻觉行为。只需对这些主流评测进行一些不难办的改动，就能重新校准激励机制，让模型在表达不确定性时获得奖励，而不是遭到惩罚。

简而言之，

而且这种模式不仅能消除抑制幻觉的障碍，还为未来更具细微语用能力的语言模型打开了大门。

尤其值得一提的是，

这一发现对OpenAI很关键：评测体系直接影响LLM的能力。

大家常常忽略的是，

据报道，在发给员工的备忘录中，OpenAI首席科学家Mark Chen指出，把模型行为进一步融入核心模型研发，现正是好机会。

XM外汇财经新闻：

咱们亲手让AI学会了一本正经地胡说八道

值得注意的是，

就在最近，OpenAI的研究员就做了一个有趣的测试。

但实际上，

他们先是问一个主流AI机器人：「Adam Tauman Kalai（论文一作）的博士论文题目是什么？」

机器人自信地给出了三个不同的答案，但没有一个是正确的。

接着他们又问：「Adam Tauman Kalai的生日是哪天？」

这次机器人还是给出了三个不同的日期，同样全是错的。

容易被误解的是，

为了拿高分，AI被逼「拍脑袋」作答

上面这个例子，生动地展示了什么是「模型幻觉」——即AI生成的那些看似合理、实则虚构的答案。

在最新的研究中，OpenAI指出：

不妨想一想，

模型之于是会产生幻觉，是鉴于标准的训练和评估程序奖励猜测行为，而非鼓励模型承认其不确定性。

简而言之，

不难办来说就是，咱们在评估AI时，设定了错误的激励导向。

XM外汇消息：

虽然评估本身不会直接造成幻觉，但大多数评估方法会促使模型去猜测答案，而不是诚实地表明自己不确定。

说出来你可能不信，

这就像一场充满挑选题的大型「应试教育」。

XM外汇用户评价：

如果AI遇到不会的题目，挑选留白不答，铁定是0分；而如果随便猜一个，总有蒙对的概率。

其实，

在积累了成千上万道题后，一个爱「蒙答案」的AI，就会比一个遇到难题时表示「不知道」的AI得分更高。

请记住，

当前的行业主流，便是用这种「唯准确率论」的排行榜来评判模型优劣。

其实，

这无形中鼓励所有开发者去训练一个更会「猜」而不是更「诚实」的模型。

需要注意的是，

这就是为什么即便模型越来越先进，它们依然会产生幻觉。

尽管如此，

为了有一个更直观的感受，咱们来看看OpenAI在GPT-5系统卡中公布的一组对比数据：

从数据中能够发现：

幻觉源于「下一个token预测」

除了评估体系的导向疑问，幻觉的产生还与大语言模型的学习机制息息相关。

通过「下一个token预测」，模型掌握了语法、语感和常识性关联，但它的短板也正在于此。

理想情况下，这些幻觉应该能在模型预训练完成后的环节中被消除。

事实上，

但正如上一节所述，由于评估机制的原因，这一目标并未完全实现。

如何教AI「学会放弃」？

尤其值得一提的是，

对此，OpenAI的建议是：

应该重罚「自信地犯错」（confidential error），并为「诚实地承认不确定性」给予加分。

就像咱们考试中的「答错倒扣分」机制一样。

说到底，

这不仅仅是通过加入新评测来「补全」就行的，而是要更新所有主流的、依靠准确率的评估体系。

简而言之，

最后，OpenAI也集中回应了关于幻觉的几个常见误解：

反过来看，

参考资料：

需要注意的是，

https://techcrunch.com/2025/09/05/openai-reorganizes-research-team-behind-chatgpts-personality/

https://openai.com/index/why-language-models-hallucinate/

与其相反的是，

返回搜狐，查看更多

发表评论取消回复