从幻觉到真实：破解大语言模型世界模型的认知迷思

2026-04-07 · 0 次浏览 ·来源: AI导航站

本文深入探讨大型语言模型是否具备连贯的内在世界模型这一核心议题。研究团队通过理论分析与实证验证，揭示了多令牌预测（MTP）虽能促进内部信念状态的收敛，却容易引发结构性幻觉问题。为此，他们提出一种名为潜在语义增强MTP（LSE-MTP）的新方法，将离散令牌预测锚定在真实隐藏状态轨迹上，显著提升了表征对齐度、降低了幻觉风险，并在合成图结构和现实曼哈顿出租车数据集上验证了其有效性，为构建更可靠的AI认知系统提供了新路径。

当人类谈论一个复杂世界的运行规律时，我们依赖的是大脑中构建的、不断更新的内在模型——这个模型帮助我们预测未来、解释过去、并据此做出决策。对于人工智能而言，尤其是近年来迅猛发展的大型语言模型（LLMs），它们是否也在其内部构建了一个类似的人类认知框架？这个被称为‘世界模型’的概念，正成为理解AI智能本质的关键谜题。

长期以来，训练LLM的标准范式是下一个令牌预测（NTP），即模型学习根据已有文本序列，预测下一个最可能出现的词元。这种一步到位的监督方式虽然高效，但其对模型的‘认知结构’施加了过于简化的约束，导致模型更擅长模仿语言模式，而非真正理解世界运行的逻辑。

多令牌预测的潜力与陷阱

为探索更深层的世界模型，研究者们转向了多令牌预测（MTP），即让模型同时预测未来多个时间步的输出。这种方法被寄予厚望，因为它迫使模型必须考虑更远的未来，从而可能捕捉到事件之间的因果关系和长程依赖，形成更结构化、更稳定的内部表征。

然而，深入分析发现，MTP并非完美无缺。它虽然在一定程度上促进了内部信念状态的收敛，但同时也带来了一个新的挑战：结构性幻觉。这意味着，尽管模型表面上看起来预测得“很准”，但在其潜藏的内部空间中，可能存在一些违背物理或逻辑常识的‘捷径’。这些捷径是离散令牌监督信号所鼓励的，因为它们能更快地引导模型到达正确的输出，却牺牲了对真实环境动态的忠实建模。

这就像一个人虽然能准确描述一个物体的颜色，却完全误解了它的重量、材质和运动规律。模型可以‘说’出正确的话，却无法真正‘理解’世界。

LSE-MTP：将离散思维锚定于连续现实

针对这一根本性缺陷，研究团队提出了创新的解决方案——潜在语义增强MTP（LSE-MTP）。该方法的精髓在于，它不再仅仅依赖于离散的令牌作为监督信号，而是引入了一个关键的桥梁：真实世界的隐藏状态轨迹。

想象一下，一个机器人通过摄像头观察周围环境，它看到的是一系列连续的像素图像（连续状态），而不是离散的词语。LSE-MTP的核心思想就是，在训练过程中，不仅要求模型对未来的词语进行预测，更要确保其内部的潜在表征能够忠实地跟随真实的、连续的环境变化轨迹。换句话说，模型不仅要‘说’得对，还要在‘想’的时候，其思维过程与真实世界的物理规律保持一致。

通过在合成图和曼哈顿出租车等真实数据集上的实验，LSE-MTP展现出了卓越的性能。它不仅显著减少了结构性幻觉的发生，更重要的是，它极大地增强了模型表征的对齐能力。这意味着，模型内部关于世界的‘心理地图’与现实世界的‘真实地图’之间的一致性得到了极大提升。此外，这种改进还带来了更强的鲁棒性，使模型在面对环境扰动或噪声时，能够做出更加稳定和可靠的判断。

超越令牌：迈向可信的认知智能

这项工作的意义远不止于提出一个新的算法。它深刻地揭示了大语言模型当前面临的根本性挑战：它们的‘认知’仍然停留在对符号的统计关联之上，缺乏对世界底层连续动态机制的深刻理解。

从行业角度看，LSE-MTP代表了一种范式转变。它提醒我们，仅仅追求更高的预测准确率是不够的，构建可信的人工智能必须要求其内部机制与现实世界保持高度一致。这对于需要做出关键决策的领域，如自动驾驶、医疗诊断和复杂系统控制，尤为重要。一个能够‘理解’物理定律和因果关系的AI，远比一个仅擅长语言游戏的AI更具价值。

展望未来，LSE-MTP为构建下一代具有真实世界建模能力的AI系统铺平了道路。它启发我们思考如何将更多的感知模态（视觉、听觉、触觉等）和物理规律融入到模型的训练过程中，使其不再仅仅是文本的奴隶，而能成为驾驭知识的真正‘认知主体’。这不仅是技术上的突破，更是通往通用人工智能（AGI）道路上至关重要的一步。