微软发布MAI-DxO:AI诊断准确率超越医生
微软MAI-DxO:医疗AI诊断领域的重大突破
微软CEO萨提亚·纳德拉近日宣布推出革命性医疗AI系统MAI-DxO,旨在提升医疗诊断准确率。这一创新平台采用"模型无关"设计,可与不同厂商的各种语言模型协同工作,同时显著提升其诊断能力。
前所未有的诊断准确率
在采用《新英格兰医学杂志》56个病例的对比测试中,MAI-DxO表现出色:
- 人类医生(21位拥有10年以上经验的专业人士):19.9%准确率
- 使用OpenAI o3模型的MAI-DxO:81.9%准确率
- 集成模式下的MAI-DxO:85.5%准确率(是人类的四倍多)
MAI-DxO工作原理
系统通过专业虚拟医生模拟医疗团队协作:
- 假设医生:维护鉴别诊断列表
- 检查选择医生:选择最优诊断测试
- 质疑医生:识别偏见并挑战假设
- 管理医生:优化性价比高的检查方案
- 清单医生:确保推理一致性和质量控制
针对不同需求的五种操作模式
MAI-DxO为不同医疗场景提供灵活操作模式:
- 即时回答模式:快速初步诊断(紧急情况使用)
- 仅提问模式:模拟初级诊疗过程
- 预算控制模式:包含成本控制机制
- 无预算限制模式:针对复杂病例最大化准确性
- 集成模式:多个虚拟团队并行工作
推出SDBench:新型诊断标准
与MAI-DxO同步,微软发布了交互式评估框架SDBench,将304个疑难病例转化为逐步诊断场景。该基准包括:
- 模拟信息获取的"守门人"代理
- 进行多维评估的"法官"代理
- 评估中整合成本考量
这一系统代表了医疗AI领域的重大进步,有望在显著提高准确率的同时降低诊断成本。
关键要点:
- MAI-DxO诊断准确率达85.5%,远超医生的19.9%
- 采用独特"模型无关"设计,兼容多种AI模型
- 通过专业虚拟医生模拟医疗团队协作
- 提供五种操作模式满足不同临床需求
- 推出SDBench作为诊断评估新行业标准


