百川智能发布最强医疗大模型M2 Plus:循证增强,医疗AI进入新阶段

AI资讯5小时前更新 xueke
104 00

百川智能发布最强医疗大模型M2 Plus:循证增强,医疗AI进入新阶段

医疗AI迎来重大突破! 2025年10月22日,百川智能正式推出业内首个“循证增强”医疗大模型——Baichuan-M2 Plus,标志着医疗AI从“经验驱动”迈向“证据+算法驱动”的新阶段。该模型在多项权威医学考试中超越人类医生,幻觉率大幅降低,成为全球医疗AI领域的新标杆。

01 医疗AI的痛点:幻觉问题成最大瓶颈

长期以来,医疗AI面临的最大挑战是“幻觉”问题。通用大模型在医疗应用中常出现“知识丰富但不可靠”的情况,即便加入检索增强或知识库,也难以完全避免错误或虚构内容。这种不确定性在医疗领域尤为致命,一条错误建议可能带来严重后果。因此,尽管中国医疗AI产品众多,医院对其实际采用始终谨慎。

相比之下,美国的OpenEvidence却成功落地,约40%的美国医生在临床场景中使用该产品,每月咨询量高达1650万次。其核心亮点在于有理有据的医疗问答,能从海量文献中搜索信息,为医生决策提供清晰、可验证的回答。

OpenEvidence:有理有据的医疗问答

关键启示:医疗AI要真正落地,关键在于遵循现代医学的核心逻辑——循证医学(EBM)。循证医学强调医学决策必须基于系统整合的最佳研究证据、医生临床经验及患者需求,摒弃“凭经验行医”的传统模式。

02 循证增强:M2 Plus的核心创新

百川智能从循证医学中汲取灵感,提出**“六源循证推理范式”**,将循证原则嵌入AI系统底层,使模型能够像医生一样识别、筛选并权衡不同层级的医学证据。

六源循证知识体系

M2 Plus构建了从证据到实践、再到真实世界反馈的六层证据体系:

  1. 原始研究层:索引超4000万篇医学期刊论文,回答“事实是否存在”。
  2. 证据综述层:整合系统评价和Meta分析,回答“结论是否一致”。
  3. 指南规范层:汇聚国内外权威临床指南,回答“行业如何规范”。
  4. 实践知识层:收录临床病例报道和专家经验,回答“医生应如何决策”。
  5. 公共健康教育层:整合权威科普知识,回答“患者应如何理解”。
  6. 监管与真实世界层:涵盖药监公告和真实世界研究数据,回答“是否存在新风险”。
六源循证推理范式

PICO智能检索系统

M2 Plus借鉴循证医学的PICO框架(人群、干预、对照、结局),打造了基于PICO的搜索系统,使模型具备临床医生式的提问与检索能力。该系统通过强化学习驱动的多层PICO查询生成机制,实现“地毯式”证据搜索,兼顾精度与广度。

循证强化训练机制

为确保模型“用对证据”,M2 Plus加入了循证强化训练机制,鼓励模型优先选择权威信源,惩罚无凭无据的臆测,并对正确引用提供额外奖励。这一机制赋予了AI回答更高的可解释性与可信赖度。

03 性能超越:多国医疗考试中的卓越表现

M2 Plus在多项国际与国内权威医学考试中展现了超越人类医生的水平:

  • 美国执业医师资格考试(USMLE):取得97分,与GPT-5并列全球第一梯队,显著高于人类考生平均水平。
  • 中国执业医师资格考试(NMLE):以568分的成绩远超及格线360分,领先所有公开测试的主流模型。
  • 中国硕士研究生招生考试临床医学综合能力(西医):取得282分,达到协和、北医等顶尖学府的头部学霸水平。
  • 日本、英国、澳大利亚等国高级医师职称晋升考试:准确率达85%以上,远超各国及格线。
M2 Plus在多国医疗考试中的表现

04 一线医生评价:从实验室到临床的落地

M2 Plus不仅在考试中表现优异,更在实际临床应用中获得了医生的高度认可。

临床指南查询:效率与准确性大幅提升

北京天坛医院的熊医生表示,以往新指南发布后,医生需花费大量时间手动检索和比对旧版内容,尤其在多学科交叉领域,信息量大且易遗漏关键更新。如今,医生只需在百小应中输入问题,系统即可快速梳理出核心更新要点,并提供文献链接供验证。

临床指南查询场景

科研文献整合:站在未来看进展

熊医生在研究PACAP在偏头痛中的研究进展时发现,相关研究众多,但有价值文献难找,多数大模型因幻觉问题不可用。搭载M2 Plus的百小应能在数分钟内整合最新研究结果,自动进行主题聚类与逻辑归纳,避免信息冗余和误导性解读。

PACAP偏头痛研究进展

罕见病辅助诊断:快速制定检查方法

在临床工作中,医生难免遇到病史特殊、考虑罕见病的病患,检查结果无法指向具体疾病。百小应可辅助整合信息,推测潜在罕见病,帮助医生快速制定检查方法。

罕见病辅助诊断场景

05 开放生态:推动AI在真实临床的落地

目前,接入M2 Plus的百小应已在各大手机应用商店更新,成为“医生版ChatGPT”。网页版(ying.ai)也同步上线,方便电脑端使用。此外,Baichuan-M2 Plus提供标准化API接口,医院信息化部门、互联网医疗、大健康服务等各类泛医学机构,以及从事医疗AI行业的开发者,可通过API将循证推理接入服务场景,提升AI服务的医学专业性。

06 结语:医疗AI的新篇章

Baichuan-M2 Plus的发布,标志着医疗AI进入“循证增强”的新阶段。通过首创的“六源循证”推理范式,M2 Plus显著提升了模型在复杂医学知识运用上的可靠性,有效降低幻觉率,为临床医生的决策提供了有力辅助。它不仅有望缓解基层医疗机构人手不足和信息滞后的压力,还能为广大患者及家属提供真正可靠的医疗AI服务,帮助他们理解诊断、治疗、预后及检查背后的科学逻辑。

从Baichuan-M2的开源,到M2 Plus的发布,再到百小应的升级,百川智能正推动AI在真实临床的落地应用,让大模型在严肃医疗场景真正可用,代表中国在全球医疗AI领域取得又一突破。

参考来源

  1. 智东西 · 2025年10月23日 · https://aistudio-llm-static-online.bj.bcebos.com/blog-content-flow/wechat-article/20251023/MzA4MTQ4NjQzMw==/HoTGUg1_nNPwxpju5Aqnsw/images/智东西_百川最强医疗大模型M2%20Plus发布,幻觉率降到DeepSeek三成,超越美国爆火医疗AI产品.html
© 版权声明

相关文章