跳转到主要内容

百川新一代医疗AI超越医生与GPT-5.2表现

百川医疗AI重大突破超越人类医生

这项可能重塑医疗诊断领域的进展中,百川智能今日推出Baichuan-M3模型——这款开源医疗AI在多维度基准测试中同时超越了人类医师和OpenAI最新的GPT-5.2。

基准测试全面领先

新模型在四项关键评估中拔得头筹:

  • 诊断准确性
  • 医疗幻觉控制
  • Healthbench标准测试
  • Healthbench Hard挑战赛

为何这些结果如此瞩目?该系统不仅小幅领先竞争对手——更在所有测试场景中都确立了明显优势。

"2023年我们起步时质疑声不断,"创始人王小川在北京发布会回忆道,"但DeepSeek的2025版本发布后,医学界开始以不同视角看待AI。今天的成果印证了这个转变。"

谈及与百度的对比时,王小川的发言引发在场观众会心一笑:"人们发现它比现有替代方案可靠得多。"

医疗AI临界点已至

随着OpenAI、Anthropic等科技巨头加倍投入医疗应用,王小川将Baichuan-M3的发布定位为 healthcare数字化拐点的到来。

"我们已跨越理论阶段,"他强调说,"医疗AI不是将要到来——它已经在此刻提供真实的临床价值。"

开源模式有望加速应用落地,让全球医院和研究机构无需面对许可壁垒即可部署并基于Baichuan-M3进行二次开发。

核心亮点:

  • 性能飞跃:Baichuan-M3超越GPT-5.2和人类基准线
  • 开放获取:模型开源以促进创新
  • 行业转向:医师群体对诊断型AI接受度提升
  • 实用导向:专为真实临床场景设计

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

中国发布突破性开源医疗AI模型

浙江省推出了拥有1000亿参数的AntAngelMed,这是目前全球最强大的开源医疗AI模型。该技术由蚂蚁集团与国家人工智能应用试点基地(医疗)联合开发,专注于精准诊断和心理健康支持,同时完全兼容国产芯片。该模型已应用于两个临床场景:心脏护理随访和青少年心理健康支持。

December 22, 2025
medicalAIhealthtechopensource
豆蔻妇科AI模型实现行业首创
News

豆蔻妇科AI模型实现行业首创

壹生健康的'豆蔻'妇科AI模型基于钉钉平台开发,已通过中国国家妇产科专业考试。这是首个由初创企业开发达到临床标准的垂直医疗AI模型,展现了企业级AI平台在专业领域的潜力。

July 29, 2025
medicalAIhealthtechenterpriseAI
News

谷歌最新医疗AI举措:可能变革医疗行业的开源模型

谷歌发布了升级版医疗AI模型MedGemma 1.5,现可同时解读扫描影像与文本,以及将医生语音转为笔记的MedASR。这些开源工具旨在减轻诊断和文书工作负担,同时保持严格的隐私标准。此举标志着谷歌向协作式医疗AI开发的转变。

January 14, 2026
medicalAIhealthcareTechopenSource
News

中国AI模型百川-M3在医疗评估中超越医生表现

百川智能发布了具有突破性的百川-M3医疗AI模型,该模型在临床评估中表现优于OpenAI的GPT-5.2和人类医生。这款开源模型专精于疾病诊断、治疗建议和患者沟通,标志着AI在医疗领域的重大飞跃。创始人王小川认为这证明医疗AI已从理论走向实际应用。

January 13, 2026
medicalAIBaichuanIntelligencehealthcareTechnology
百川发布面向医疗专业人士的M2Plus AI模型
News

百川发布面向医疗专业人士的M2Plus AI模型

百川推出其先进的医疗AI模型M2Plus,具备增强的循证推理能力。该模型在减少医疗幻觉方面表现出卓越性能,并在美国医师执照考试(USMLE)中获得97分,成为临床决策的宝贵工具。

October 22, 2025
medicalAIBaichuanclinicaldecisionmaking
中国首个主任医师认证AI模型登陆夸克搜索
News

中国首个主任医师认证AI模型登陆夸克搜索

夸克健康AI模型成为中国首个通过12个医学学科主任医师严格测试的系统。该模型集成至夸克AI搜索,凭借创新的'慢思考'能力及数千名医学专家支持的高级训练体系,在复杂医学推理中展现出卓越性能。

July 23, 2025
medical AIhealthtechclinical decision support