当AI开始“思考”：大模型在医疗决策中是否真的理性？

2026-02-09 · 0 次浏览 ·来源: AI导航站

随着大型语言模型在医疗诊断等高风险场景中的广泛应用，其决策逻辑的可靠性成为关键议题。一项最新研究通过分析模型在诊断挑战中的表现，检验其是否具备理性代理的核心特征——信念一致性与效用最大化能力。研究引入可证伪的数学框架，揭示模型输出的概率与行为之间常存在矛盾，暗示其推理过程偏离理想贝叶斯决策模型。这不仅挑战了将LLMs视为可靠代理的预设，也为高风险领域的AI部署敲响警钟。

在急诊室、影像科和病理分析中心，人工智能正悄然参与着关乎生死的判断。当医生面对模糊症状或复杂影像时，大型语言模型（LLMs）被寄予厚望，成为辅助决策的“第二大脑”。然而，这些模型是否真的像人类专家一样，基于清晰信念和稳定偏好做出理性选择？还是仅仅在模仿语言模式，掩盖内在逻辑的断裂？

理性代理的理想与现实

理性代理理论源于经济学与决策科学，其核心假设是：一个理性主体在面对不确定性时，会通过贝叶斯更新调整信念，并选择能最大化期望效用的行动。这一框架在医疗诊断中尤为关键——医生需权衡不同病因的概率，同时考虑误诊带来的临床后果。若将LLMs视为此类代理，其输出的概率判断与实际行动之间必须保持内在一致。

然而，现实远比理论复杂。研究者在多个医疗诊断场景中测试了不同LLMs的表现，发现一个令人不安的现象：模型在“说出”某疾病概率的同时，其推荐的诊断路径却与该概率严重不符。例如，在疑似心肌梗死的案例中，模型可能报告“可能性为70%”，却建议进行低敏感度的初步筛查而非直接启动介入流程。这种言行不一，暴露出模型内部信念系统的脆弱性。

可证伪的检验：当概率不再可信

传统评估往往依赖准确率或F1分数，但这些指标无法捕捉决策逻辑的深层一致性。为此，研究引入了一种新颖的数学方法：通过构建效用函数与概率分布的联合模型，检验模型行为是否可被任何理性代理所解释。若存在一组稳定的信念与偏好，使得模型的所有决策都符合效用最大化原则，则称其具备信念一致性。

结果令人警醒。在多个测试案例中，模型的行为无法被任何合理的信念-效用组合所解释。这意味着，其报告的“概率”并非真实信念的反映，而更可能是语言生成过程中的统计拟合产物。这种“伪理性”现象在跨模型比较中普遍存在，提示问题并非个别模型的缺陷，而是当前架构的共性局限。

语言幻觉与决策脱节

LLMs的本质是序列预测器，其训练目标是最小化下一个词元的预测误差，而非构建连贯的世界模型。这种机制导致一个根本矛盾：模型擅长生成看似合理的概率陈述，却缺乏将这些陈述整合进决策框架的能力。当被要求解释其推理过程时，模型往往编织出逻辑严密的“事后叙事”，但这些叙事与实际决策路径并无因果关联。

更深层的问题在于，模型对“效用”的理解是形式化的。它能复述“误诊癌症的代价高于漏诊”，却无法真正内化这种代价在决策权重中的体现。其行为更像是在语言空间中寻找最“流畅”的回应，而非在信念空间中执行最优策略。这种脱节在低风险场景中尚可容忍，但在医疗等关键领域，可能引发系统性误判。

从模仿到代理：重构AI的决策基础

将LLMs从“语言模拟器”转变为“理性代理”，需要根本性的架构革新。当前主流方法依赖提示工程或微调来引导行为，但这些手段治标不治本。真正的突破可能来自将概率推理与效用计算显式嵌入模型架构，例如通过神经符号系统或贝叶斯神经网络，使信念更新与行动选择在同一框架下协同优化。

此外，评估范式也需转变。除了准确率，应建立“决策一致性指数”，量化模型在不同表述下信念的稳定性；引入对抗性测试，检验其在反事实场景中的推理鲁棒性。监管层面，高风险应用应要求模型提供可验证的信念-行动映射，而非仅输出最终结论。

前路：谨慎前行中的希望

尽管挑战严峻，研究也发现部分模型在特定任务中展现出接近理性的行为模式。这表明，通过精心设计训练目标与评估机制，LLMs具备向真正代理演进的潜力。未来方向包括：构建包含效用反馈的强化学习框架，使模型在模拟环境中学习权衡风险；开发“信念审计”工具，实时监控模型内部状态的一致性。

医疗AI的终极目标不是替代医生，而是成为值得信赖的协作者。这要求我们放弃对“类人智能”的浪漫想象，转而追求可解释、可验证、可纠正的决策系统。当模型能清晰展示其信念如何随证据演变，并据此调整行动时，我们才真正拥有了理性代理的雏形。在那之前，任何将LLMs投入高风险决策的尝试，都应伴随审慎的怀疑与严格的边界。