百川智能发布最强医疗大模型M2 Plus：循证增强，医疗AI进入新阶段

8,372 00

百川智能发布最强医疗大模型M2 Plus：循证增强，医疗AI进入新阶段

医疗AI迎来重大突破！ 2025年10月22日，百川智能正式推出业内首个“循证增强”医疗大模型——Baichuan-M2 Plus，标志着医疗AI从“经验驱动”迈向“证据+算法驱动”的新阶段。该模型在多项权威医学考试中超越人类医生，幻觉率大幅降低，成为全球医疗AI领域的新标杆。

01 医疗AI的痛点：幻觉问题成最大瓶颈

长期以来，医疗AI面临的最大挑战是“幻觉”问题。通用大模型在医疗应用中常出现“知识丰富但不可靠”的情况，即便加入检索增强或知识库，也难以完全避免错误或虚构内容。这种不确定性在医疗领域尤为致命，一条错误建议可能带来严重后果。因此，尽管中国医疗AI产品众多，医院对其实际采用始终谨慎。

相比之下，美国的OpenEvidence却成功落地，约40%的美国医生在临床场景中使用该产品，每月咨询量高达1650万次。其核心亮点在于有理有据的医疗问答，能从海量文献中搜索信息，为医生决策提供清晰、可验证的回答。

关键启示：医疗AI要真正落地，关键在于遵循现代医学的核心逻辑——循证医学（EBM）。循证医学强调医学决策必须基于系统整合的最佳研究证据、医生临床经验及患者需求，摒弃“凭经验行医”的传统模式。

02 循证增强：M2 Plus的核心创新

百川智能从循证医学中汲取灵感，提出**“六源循证推理范式”**，将循证原则嵌入AI系统底层，使模型能够像医生一样识别、筛选并权衡不同层级的医学证据。

六源循证知识体系

M2 Plus构建了从证据到实践、再到真实世界反馈的六层证据体系：

原始研究层：索引超4000万篇医学期刊论文，回答“事实是否存在”。
证据综述层：整合系统评价和Meta分析，回答“结论是否一致”。
指南规范层：汇聚国内外权威临床指南，回答“行业如何规范”。
实践知识层：收录临床病例报道和专家经验，回答“医生应如何决策”。
公共健康教育层：整合权威科普知识，回答“患者应如何理解”。
监管与真实世界层：涵盖药监公告和真实世界研究数据，回答“是否存在新风险”。

PICO智能检索系统

M2 Plus借鉴循证医学的PICO框架（人群、干预、对照、结局），打造了基于PICO的搜索系统，使模型具备临床医生式的提问与检索能力。该系统通过强化学习驱动的多层PICO查询生成机制，实现“地毯式”证据搜索，兼顾精度与广度。

循证强化训练机制

为确保模型“用对证据”，M2 Plus加入了循证强化训练机制，鼓励模型优先选择权威信源，惩罚无凭无据的臆测，并对正确引用提供额外奖励。这一机制赋予了AI回答更高的可解释性与可信赖度。

03 性能超越：多国医疗考试中的卓越表现

M2 Plus在多项国际与国内权威医学考试中展现了超越人类医生的水平：

美国执业医师资格考试（USMLE）：取得97分，与GPT-5并列全球第一梯队，显著高于人类考生平均水平。
中国执业医师资格考试（NMLE）：以568分的成绩远超及格线360分，领先所有公开测试的主流模型。
中国硕士研究生招生考试临床医学综合能力（西医）：取得282分，达到协和、北医等顶尖学府的头部学霸水平。
日本、英国、澳大利亚等国高级医师职称晋升考试：准确率达85%以上，远超各国及格线。

04 一线医生评价：从实验室到临床的落地

M2 Plus不仅在考试中表现优异，更在实际临床应用中获得了医生的高度认可。

临床指南查询：效率与准确性大幅提升

北京天坛医院的熊医生表示，以往新指南发布后，医生需花费大量时间手动检索和比对旧版内容，尤其在多学科交叉领域，信息量大且易遗漏关键更新。如今，医生只需在百小应中输入问题，系统即可快速梳理出核心更新要点，并提供文献链接供验证。

科研文献整合：站在未来看进展

熊医生在研究PACAP在偏头痛中的研究进展时发现，相关研究众多，但有价值文献难找，多数大模型因幻觉问题不可用。搭载M2 Plus的百小应能在数分钟内整合最新研究结果，自动进行主题聚类与逻辑归纳，避免信息冗余和误导性解读。

罕见病辅助诊断：快速制定检查方法

在临床工作中，医生难免遇到病史特殊、考虑罕见病的病患，检查结果无法指向具体疾病。百小应可辅助整合信息，推测潜在罕见病，帮助医生快速制定检查方法。

05 开放生态：推动AI在真实临床的落地

目前，接入M2 Plus的百小应已在各大手机应用商店更新，成为“医生版ChatGPT”。网页版（ying.ai）也同步上线，方便电脑端使用。此外，Baichuan-M2 Plus提供标准化API接口，医院信息化部门、互联网医疗、大健康服务等各类泛医学机构，以及从事医疗AI行业的开发者，可通过API将循证推理接入服务场景，提升AI服务的医学专业性。

06 结语：医疗AI的新篇章

Baichuan-M2 Plus的发布，标志着医疗AI进入“循证增强”的新阶段。通过首创的“六源循证”推理范式，M2 Plus显著提升了模型在复杂医学知识运用上的可靠性，有效降低幻觉率，为临床医生的决策提供了有力辅助。它不仅有望缓解基层医疗机构人手不足和信息滞后的压力，还能为广大患者及家属提供真正可靠的医疗AI服务，帮助他们理解诊断、治疗、预后及检查背后的科学逻辑。

从Baichuan-M2的开源，到M2 Plus的发布，再到百小应的升级，百川智能正推动AI在真实临床的落地应用，让大模型在严肃医疗场景真正可用，代表中国在全球医疗AI领域取得又一突破。

参考来源：

智东西 · 2025年10月23日 · https://aistudio-llm-static-online.bj.bcebos.com/blog-content-flow/wechat-article/20251023/MzA4MTQ4NjQzMw==/HoTGUg1_nNPwxpju5Aqnsw/images/智东西_百川最强医疗大模型M2%20Plus发布，幻觉率降到DeepSeek三成，超越美国爆火医疗AI产品.html