百川新一代医疗AI超越医生与GPT-5.2表现
百川医疗AI重大突破超越人类医生
这项可能重塑医疗诊断领域的进展中,百川智能今日推出Baichuan-M3模型——这款开源医疗AI在多维度基准测试中同时超越了人类医师和OpenAI最新的GPT-5.2。
基准测试全面领先
新模型在四项关键评估中拔得头筹:
- 诊断准确性
- 医疗幻觉控制
- Healthbench标准测试
- Healthbench Hard挑战赛
为何这些结果如此瞩目?该系统不仅小幅领先竞争对手——更在所有测试场景中都确立了明显优势。
"2023年我们起步时质疑声不断,"创始人王小川在北京发布会回忆道,"但DeepSeek的2025版本发布后,医学界开始以不同视角看待AI。今天的成果印证了这个转变。"
谈及与百度的对比时,王小川的发言引发在场观众会心一笑:"人们发现它比现有替代方案可靠得多。"
医疗AI临界点已至
随着OpenAI、Anthropic等科技巨头加倍投入医疗应用,王小川将Baichuan-M3的发布定位为 healthcare数字化拐点的到来。
"我们已跨越理论阶段,"他强调说,"医疗AI不是将要到来——它已经在此刻提供真实的临床价值。"
开源模式有望加速应用落地,让全球医院和研究机构无需面对许可壁垒即可部署并基于Baichuan-M3进行二次开发。
核心亮点:
- 性能飞跃:Baichuan-M3超越GPT-5.2和人类基准线
- 开放获取:模型开源以促进创新
- 行业转向:医师群体对诊断型AI接受度提升
- 实用导向:专为真实临床场景设计


