百川M2Plus模型将医疗幻觉减少三倍
百川发布突破性医疗AI模型M2Plus
北京,2025年10月22日 – AI公司百川推出了其新一代医疗大语言模型M2Plus,实现了业界专家所称的"迄今为止最显著的医疗幻觉率降低"。此次发布同时伴随其配套应用百晓莺的升级和新API的推出。
卓越的性能指标
独立评估显示,与DeepSeek等现有模型相比,M2Plus将医疗幻觉(错误或虚构信息)减少了约三倍。值得注意的是,它甚至超越了目前领先的美国医疗AI应用OpenEvidence。
图片来源:通过Midjourney许可生成的AI图像
六源证据框架
该模型的突破源于其专有的六源循证推理(EAR)架构:
- 原始临床研究
- 系统性证据综述
- 医学指南
- 实用临床知识
- 公共卫生教育材料
- 监管/真实世界数据
"这不仅仅是另一个带有医学术语的聊天机器人,"百川首席医学官李伟博士解释道。"M2Plus作为临床决策支持系统运行,在生成回答前会交叉引用多个权威来源。"
技术创新
该模型采用:
- PICO框架:将自然语言查询转化为结构化临床问题以实现精确证据检索
- 证据增强训练:要求回答引用可验证的来源同时抑制推测性内容
- 动态质量评分:使用类似同行评审标准的标准评估证据可靠性
实际验证
在12家医院的临床测试中:
- 94%的诊断建议准确率(vs. 之前模型的78%)
- 62%的医生验证时间减少
- USMLE执照考试获得97/100分 – 超越大多数人类考生
"差异犹如昼夜,"北京协和医院胸外科医生张宇报告说。"在讨论罕见肿瘤病例时,M2Plus提供了带有适当警示和清晰证据层级的答案。"
公司强调M2Plus仍是一个辅助工具而非自主诊断系统,所有输出都需要临床医生审核。
关键点:
✅ 幻觉减少:相比竞品减少错误输出约3倍 ✅ 临床验证:USMLE考试接近满分(97/100) ✅ 多源验证:通过EAR框架整合六种证据类型 ✅ 医生采用度:信息验证时间减少60%以上


