语言模型的‘阅读脉搏’：AI如何解码人类眼动背后的认知密码

2026-04-20 · 0 次浏览 ·来源: AI导航站

一项前沿研究揭示了大型语言模型在表征人类阅读行为上的惊人潜力。通过分析五种语言的注视点数据，研究者发现，相比传统心理语言学指标，模型早期层的内部表征能更精准地预测早期眼动指标；而晚期加工阶段则仍由外部计算的 surprisal（意外度）主导。这一发现不仅为‘模型是否具备类人语言处理机制’提供了关键证据，也暗示当前主流训练范式可能过度强化了高层语义整合，却忽略了底层结构对齐的重要性。

当人们阅读一段文字时，眼睛并非平稳滑动，而是在每个词上短暂停留、回视、跳跃——这些细微的眼动模式，构成了理解过程的生理镜像。长期以来，心理学家试图用数学模型解释为何某些句子读起来更费力：比如‘The horse raced past the barn fell’这类花园路径句，会显著延长阅读时间。如今，人工智能领域的语言模型正悄然闯入这个领域，它们能否捕捉到人类大脑在处理语言时的“节奏”？

近期一项发表于顶级会议的研究给出了突破性答案。研究者提出一个大胆假设：如果语言模型内部编码了与真实读者相似的语言处理轨迹，那么其各层神经活动应能预测出个体在阅读过程中的眼动反应。为此，他们构建了一个跨语言、多指标的预测框架，将21个不同架构的预训练语言模型（涵盖BERT、RoBERTa、DeBERTa等多种变体）作为探针，尝试预测来自五个语系（英语、希腊语、希伯来语、俄语和土耳其语）的两大规模眼动追踪数据集的关键指标——包括首次注视时长、凝视持续时间等早期加工信号，以及总阅读时间等晚期综合指标。

早期层级的“节奏同步”

结果令人震惊。研究发现，在预测像“首次注视”和“凝视持续时间”这样的早期眼动参数时，来自模型前几层的隐藏状态表现甚至优于经典的心理语言学预测因子——即基于N-gram统计计算的 surprisal（信息意外度）。这意味着，相较于单纯依赖词汇出现的概率偏差，模型浅层所捕获的局部语法结构或词形特征，与人类快速识别单词并初步解析句法关系的过程更为贴近。

更值得注意的是，这种预测优势呈现出清晰的层级梯度：随着网络深度增加，对早期眼动的解释力逐渐减弱。这表明，语言模型内部的表征演化路径，与人类从感知输入到初步理解的认知流程存在某种功能性同构。换句话说，就像人类阅读时先扫视再深入加工一样，模型也在低层级完成基础信息提取，随后才逐步构建复杂语义表征。

晚期加工的“Surprisal法则”

然而，一旦进入阅读过程的后半段，情况发生反转。无论是总阅读时间还是回归次数，最强大的预测源始终是外部计算的 surprisal。尽管它只是一个标量值，缺乏中间过程的细节描述，却依然稳坐晚期加工的“C位”。这揭示了一个深层矛盾：虽然模型能模拟人类早期感知阶段的节奏，但在需要全局整合与推理的高级认知任务上，仍高度依赖统计层面的预测偏差。

进一步分析显示，将 surprisal 与早期层表示联合使用，可在部分语言中进一步提升预测精度，说明二者分别捕捉了不同维度的信息。例如，在俄语这类形态丰富的语言中，早期层对屈折变化敏感，而 surprisal 则擅长捕捉长距离依存带来的理解难度。这种互补性提示我们，未来的模型设计或许不应仅追求深层语义抽象，还需强化底层结构与认知时序的一致性。

超越黑箱：迈向可解释AI的新路径

这项工作的意义远不止于验证模型与人类认知的关联。它实际上开辟了一条全新的可解释性研究道路——不再满足于事后归因，而是主动利用认知科学实验数据来指导模型架构优化。正如作者所言：“如果我们想让AI真正理解人类如何理解语言，就必须确保其内部机制与人类认知发展阶段相匹配。”

当前主流的Transformer架构之所以强大，很大程度上得益于其深度堆叠的非线性变换能力。但本研究提醒我们，这种“深度优先”的设计哲学可能存在盲区。尤其在自然语言处理任务中，许多看似高阶的能力其实建立在底层稳定的结构表征之上。因此，未来或许可以通过引入显式的时序建模模块，或在预训练目标中加入类似人类阅读路径的约束，来增强模型与人类语言处理的对齐程度。

此外，该研究的跨语言特性也为多语言AI系统的公平性提供了启示。既然不同语言的最佳预测策略各异，那么通用模型必须能够灵活适配各种语言的认知特征，而非强行套用单一范式。这对于开发真正普适的多语种助手、教育工具乃至临床语言评估系统具有深远影响。

当然，我们也需保持审慎。眼动数据虽直观，但仍只是语言理解的外围表现之一。要全面刻画人类心智的复杂性，还需结合脑电、fMRI等多模态证据。但可以肯定的是，当AI开始学会倾听人类的“阅读脉搏”，这场人机协同的认知革命已然拉开帷幕。