跳转到主要内容

新研究揭示AI在医疗诊断中的不足

AI临床推理的差距暴露

现代医学或许正在拥抱人工智能,但一项开创性研究表明我们远未达到替代人类医生的程度。麻省总医院的研究人员对21个领先的AI模型进行了严格的医学测试——结果令人警醒。

诊断困境

当提供完整的患者数据(症状、实验室结果和影像)时,ChatGPT和Gemini等AI模型表现不俗,诊断准确率超过90%。但关键问题在于:医学实践中很少能一开始就获得完整信息。在医生必须同时考虑多种潜在疾病的现实场景中(关键的"鉴别诊断"过程),超过80%的AI模型未能系统地评估相互竞争的可能性。

研究团队解释说:"这不是关于AI能否在完整数据中识别模式的问题,而是关于人工智能能否像医生一样在不完整信息下思考——目前它还做不到。"

衡量医学思维

团队开发了一套名为PrIME-LLM的综合评估体系,用于评估AI从初步检查决策到治疗计划的整个临床推理过程。评分范围仅为64%到78%,揭示了AI处理医疗问题的根本局限性。

暴露了两大关键弱点:

  1. 信息依赖性:AI在所有数据可用时表现良好,但在信息不完整时会出错
  2. 逻辑顺序:模型难以像人类医生那样系统地排除潜在诊断

医疗AI的未来之路

虽然最新模型显示出较其前代产品的显著改进,但研究人员强调它们仍然是辅助工具而非独立从业者。研究表明AI的未来发展在于超越模式识别,开发真正的推理能力。

一位研究人员指出:"这不是要取代医生,而是要理解AI真正能提供帮助的领域——以及人类专业知识仍不可替代的领域。"

关键要点

  • 测试了21个AI模型包括ChatGPT、Claude和Gemini
  • 完整信息下准确率90%以上
  • 80%的模型在数据不完整时难以进行鉴别诊断
  • PrIME-LLM评分综合临床推理得分范围64-78%
  • 当前角色:医生的助手而非替代者

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

OpenAI推出新型AI模型GPT-Rosalind 旨在革新药物研发
News

OpenAI推出新型AI模型GPT-Rosalind 旨在革新药物研发

OpenAI发布了专为生命科学研究设计的AI模型GPT-Rosalind。该工具以DNA研究先驱罗莎琳德·富兰克林命名,能帮助研究人员分析生化数据、生成假设并加速药物开发。目前正与安进和Moderna等合作伙伴进行有限预览,在某些预测任务中表现超越人类,同时也引发了关于AI在科研中作用的讨论。

April 17, 2026
医疗AI药物研发OpenAI
谷歌MedGemma 1.5 AI将医学影像提升至全新维度
News

谷歌MedGemma 1.5 AI将医学影像提升至全新维度

谷歌最新发布了开源医学AI MedGemma 1.5,这款人工智能能以惊人准确度解析复杂的三维扫描影像。此次升级突破了传统二维图像分析的局限,为医生提供了从肿瘤追踪到数字病理学的全新潜在工具。虽然尚未达到临床应用标准,该模型展现出显著改进——在保持40亿参数规模的同时,实现了两位数的准确率提升。

April 17, 2026
医疗AI谷歌研究院医疗健康AI
虚拟医生遇上AI患者:清华突破性数字诊所开启医疗新时代
News

虚拟医生遇上AI患者:清华突破性数字诊所开启医疗新时代

清华大学紫荆智康推出未来感十足的'AI医院',医生可创建自己的数字分身。这些虚拟医师与高度仿真的AI患者在模拟问诊中互动,实现实时技能提升。该系统覆盖26个临床专科,基于清华首创的'智能体医院'概念开发,标志着实验性技术向实用医疗培训工具的重大飞跃。

April 13, 2026
医疗AI虚拟医疗医生培训
AI营养教练如何超越人类专家
News

AI营养教练如何超越人类专家

当68岁的糖尿病患者李女士需要饮食建议时,她的儿子尝试了一款AI应用——结果被其实用且个性化的答复震惊了。近期一项盲测将三款AI健康助手与营养专家同台竞技,最终胜出者明确:Qwen。凭借权威数据源和可操作性建议,这款AI正在改变我们处理日常健康问题的方式——不过医生警告它不能替代医疗诊断。

April 9, 2026
AI健康助手营养科技医疗AI
蚂蚁健康AI接入中国顶级医学数据库
News

蚂蚁健康AI接入中国顶级医学数据库

在数字医疗领域迈出重要一步,蚂蚁健康AI助手'阿芙'现已全面接入中华医学会期刊权威知识库。该整合使得阿芙在回答健康咨询时能够参考最新临床指南和研究,为数百万用户提供专业医学见解。此举标志着通过AI技术在专业医学知识与公众可及性之间架起了重要桥梁。

March 17, 2026
数字医疗医疗AI健康科技
AI助力拯救爱犬:ChatGPT与AlphaFold如何设计癌症治疗方案
News

AI助力拯救爱犬:ChatGPT与AlphaFold如何设计癌症治疗方案

当AI专家Paul Conyngham的爱犬Rosie被诊断出无法治愈的肥大细胞癌时,他求助了一组意想不到的顾问:ChatGPT、AlphaFold和Grok。这些AI系统共同设计了个性化治疗方案,使Rosie的肿瘤缩小了75%。尽管专家提醒仍需更多研究,但这个暖心案例展示了AI可能如何彻底改变个性化医疗——甚至惠及我们的毛茸伙伴。

March 16, 2026
医疗AI兽医创新个性化治疗