跳转到主要内容

AI医生遭遇瓶颈:为何ChatGPT目前还无法取代你的医生

诊断困境:AI的医疗局限性暴露

你的聊天机器人可能在 trivia night 上表现优异,但你会信任它来处理你的健康问题吗?一项新研究揭示你可能还不应该这样做——至少目前如此。麻省总医院的研究人员对21个顶级AI模型进行了严格的医学测试,发现了它们在临床推理方面的惊人缺陷。

测试数字医生

研究团队在JAMA Network Open上发表了一项模拟真实世界诊断的实验。他们向ChatGPT、Claude和Gemini等模型提供了29个真实患者病例,逐步展示症状和检测结果,就像医生接收信息一样。

以下是他们的发现:

  • 期末考试得高分:当获得完整信息时,模型正确识别最终诊断的准确率超过90%
  • 思维过程不及格:但在测试其考虑替代诊断(医生称之为"鉴别诊断")的能力时,超过80%的模型表现惨淡

"这就像一个能背答案但不会展示解题过程的学生,"首席研究员Alicia Tan博士解释道。"模型可以出色地检索信息,但它们难以应对实际医学所需的开放式推理。"

推理差距

为了量化这一弱点,团队开发了PrIME-LLM评估系统,从以下方面对AI表现进行评分:

  • 初期症状评估
  • 检测项目决策
  • 治疗方案制定

结果如何?模型总体得分在64-78%之间——或许及格,但不是你希望从医生那里得到的分数。

为什么这很重要?想象一下告诉AI:

"患者有胸痛"

人类医生会考虑:

  1. 心脏病发作(立即危险)
  2. 肺炎(严重但可治疗)
  3. 胃灼热(不太紧急)

研究中大多数AI没有适当权衡选项就直接得出结论——这可能是一种危险的方法。

前进之路

虽然更新模型在处理医疗数据方面显示出巨大改进,但研究人员警告不要进行无监督的临床使用。"这些工具可以成为出色的助手,"Tan博士指出,"但它们还不准备单独行医。"

该研究强调了医疗AI的关键下一步:从模式识别转向真正的推理。在那之前,你的医生工作似乎还很安全——这对患者来说可能是最好的消息。

关键要点:

  • 获得完整信息时诊断准确率达90%
  • 鉴别诊断技能失败率达80%
  • 各模型的PrIME-LLM评分介于64-78%
  • 临床使用时仍需人类监督
  • 推理能力而不仅仅是信息检索,是下一个前沿领域

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

DeepMind CEO预测五年内实现AGI:一场前所未有的革命

在最近的播客中,DeepMind CEO Demis Hassabis对人工智能的未来做出了大胆预测,引发轰动。他认为通用人工智能(AGI)可能在五年内实现,并称其为“以十倍速度发生的十倍工业革命”。Hassabis警告称,虽然当前AI在短期内被过度炒作,但其长期影响却被低估。他还分享了关于顶尖AI公司之间差距扩大以及当前AI系统“碎片化”本质的惊人见解。

April 14, 2026
AGIDeepMindAI革命
HarmonyGNN:突破性技术让AI更擅长理解复杂关系
News

HarmonyGNN:突破性技术让AI更擅长理解复杂关系

名为HarmonyGNN的新框架正在彻底改变人工智能处理复杂网络数据的方式。这项由北卡罗莱纳州立大学研究人员开发的创新方法,帮助AI系统更好地区分数据图中不同类型的关系——实现了高达9.6%的准确率提升。与那些难以处理未标注数据的传统方法不同,HarmonyGNN尤其擅长处理异构关系,同时还提升了计算效率。该研究成果将于明年在巴西的一场重要AI会议上首次亮相。

April 14, 2026
人工智能机器学习图神经网络
News

扎克伯格的数字分身:揭秘Meta的AI克隆项目

Meta正在开发一个逼真得令人不安的马克·扎克伯格AI版本,公司员工将能够与之进行实时对话。这位数字CEO克隆目前处于早期测试阶段,通过学习扎克伯格的演讲、行为举止和战略观点不断完善。这个雄心勃勃的项目正值Meta向AI开发投入数十亿美元之际,最近推出了诸如MuseSpark等工具,同时也面临着关于数字伦理的担忧。

April 13, 2026
人工智能Meta数字人类
News

苹果AI愿景家约翰·詹南德雷亚离职,科技巨头重组AI部门

苹果前AI负责人约翰·詹南德雷亚本周正式离职,结束了自2025年初其职权被逐步削弱的过渡期。此次离职正值苹果AI计划(包括Siri升级和生成式AI开发)未能达到预期之际。他的职责现由三位高管分担,标志着苹果人工智能战略管理方式的重大转变。

April 13, 2026
苹果AI科技领导力企业重组
News

智元机器人将在上海展示会上发布新型机器人舰队及AI模型

中国机器人行业先驱智元公司正筹备其迄今最大规模的4月17日活动,届时将首发四款新型机器人模型及四套配套AI系统。这场上海大会标志着该公司的重要里程碑——其四足机器人已全部售罄。由创始人邓泰华和华为前天才少年彭志辉领衔的演讲,将展示机器人如何从实验原型转变为真实生产力工具。

April 13, 2026
机器人技术人工智能工业自动化
News

苹果AI先驱詹南德雷亚离职,科技巨头难掩追赶乏力

随着前人工智能主管约翰·詹南德雷亚即将于下周离职,苹果的AI雄心再受打击。这位2018年从谷歌加盟的高管曾肩负革新苹果AI能力的重任,却因业绩不彰在去年被逐渐边缘化。尽管苹果向Siri升级和Apple Intelligence平台等项目投入大量资源,但在生成式AI领域已被竞争对手甩在身后。詹南德雷亚的离去引发外界对苹果能否在这一关键技术领域保持竞争力的质疑。

April 13, 2026
苹果人工智能科技领导力