不可忽视的是，牛津大学最新研究：大模型诊断医疗案例准确率达94.9%

所属分类：科技

摘要

【CNMO科技消息】近日，牛津大学的一项研究发现，大型语言模型正确诊断医疗案例的准确率达到了94.9%。研究人员发现，使用大型语言模型的参与者在34.5%的案例中至少能识别出一个相关条件；完全不使用AI的对…” />

可能你也遇到过，

【CNMO科技消息】近日，牛津大学的一项研究发现，大型语言模型正确诊断医疗案例的准确率达到了94.9%。这比许多医生都要高。然而，当普通人运用相同的AI系统处理相同的情况时，其准确率下降到仅34.5%。原因是：AI并不是性能的限制因素，真正可能阻碍AI发挥其全部潜力的是本平台人类。

简而言之，

CNMO从外媒获悉，由亚当·马迪博士领导的研究吸引了近1300名参与者参与，每个人都会收到一个详细的病例情景，包括症状、病史和个人背景。研究的目的是看普通人能否运用人工智能来判断困扰所在，并决定寻求什么类型的治疗方法。

请记住，

参与者要将AI视为真正的医生，提问、描述症状并获得帮助。研究人员在实验中运用了三种不同的大型语言模型，分别是：ChatGPT-4o、Llama 3和Command R+。

说出来你可能不信，

研究人员发现，运用大型语言模型的参与者在34.5%的案例中至少能识别出一个相关条件；完全不运用AI的对照组表现更好，达到了47%；而在勾选正确行动方案时，大型语言模型客户只有44.2%的概率能答对；当AI模型独自决定时，正确率为56.3%。

困扰在于：有些人给予的信息不完整或不清楚；有些人忘记提及关键症状；有些人则是遗漏了严重程度或时间点。导致AI误解或错过了不可忽视线索。即使人工智能给出了正确的诊断，客户也不一定执行，这部分不是机器所特有的，人们也会忽视医生的建议。

据CNMO了解，一些AI系统已经在实际的医疗流程中获得了关注。例如，OpenEvidence被医生用来搜索和验证临床文献。它不是用来取代医生，而是增强他们 XM外汇平台的能力。返回搜狐，查看更多