当AI学会说‘这个’和‘那个’：语言背后的文化密码与人类认知的边界

2026-04-28 · 0 次浏览 ·来源: AI导航站

一项突破性研究通过分析指示词（如“这个”“那个”）揭示了人类跨语言认知差异，并发现主流大模型在具身认知和文化理解上存在严重缺陷。研究对比了6400名母语者的数据，证明英语使用者倾向以自我为中心判断距离，而中文使用者更擅长灵活转换视角；然而GPT、Claude等五大顶尖模型却完全无法捕捉这种文化差异，暴露出当前AI在理解真实世界经验方面的根本局限。该研究不仅提出了一种全新的评估范式，也为构建更具人类共情能力的人工智能指明了方向。

在人工智能迅猛发展的今天，我们习惯于将大语言模型视为无所不知的知识宝库。它们能撰写论文、创作诗歌、解答问题，似乎正在逼近人类的智能水平。但一个更深层次的问题始终悬而未决：这些模型真的理解我们所处的物理世界吗？它们是否掌握了我们文化中那些看似微小却至关重要的常识？

从‘这个’到‘那个’：揭开认知差异的面纱

最近一项开创性研究为我们提供了审视这一问题的全新视角——它聚焦于人类语言中最基础也最复杂的表达之一：指示词。以英语中的‘this’和‘that’，或汉语中的‘这’和‘那’为例，这些词语看似简单，实则承载着丰富的空间关系、文化背景乃至个体认知策略。研究者设计了一套精巧的实验，收集了近6400名来自不同文化背景母语者的回答。结果令人惊讶：英语母语者在判断物体是‘近’还是‘远’时表现出高度一致性，但他们难以站在他人角度重新评估同一物体的位置；相反，中文母语者则展现出更强的视角灵活性，能够根据对话者立场调整判断，即使面对模糊的远端指称也表现得更为宽容。

AI为何无法理解‘这里’与‘那里’的区别？

更令人担忧的是，当我们把同样的测试交给目前最先进的五种大语言模型时，发现它们的表现远不如人类。这些模型在处理proximal-distal（近-远）关系时几乎完全依赖英语语料训练中形成的模式，呈现出明显的‘英语中心主义’倾向。无论输入哪种语言的语境，它们都倾向于采用固定不变的参照系来解释空间指示，缺乏人类那种随情境动态调整的能力。更重要的是，它们完全没有体现出任何文化差异特征——仿佛世界上只有一种看待空间的方式。

技术瓶颈背后的人类智慧之光

这项研究的重要性不仅在于揭示了大模型的局限性，更在于它重新点燃了关于人工智能本质的哲学讨论。长期以来，学界围绕‘egocentric（自我中心）vs sociocentric（社会中心）’的认知取向展开争论，但新证据表明这两种倾向并非非此即彼的对立，而是共存于不同语言群体之中，并通过日常语言实践不断协商调适。例如，汉语中‘这边/那边’的广泛使用本身就暗示着一种强调互动与关系的交际传统，这与英语中更直接的‘this/that’形成鲜明对照。遗憾的是，现有LLMs的训练方式过度依赖海量文本统计规律，忽略了真实世界中人与环境、人与人之间的动态交互过程。

迈向真正理解世界的AI之路

面对这样的挑战，我们不能简单地归咎于算力不足或数据规模不够。真正的解决方案可能需要彻底重构AI的学习机制。一方面，我们需要开发更多基于具身认知理论的任务框架，让模型通过与虚拟或物理环境的实时互动来获得空间感知能力；另一方面，也要重视多模态融合的重要性——声音、图像、触觉等多感官信息共同塑造了我们对‘此处’与‘彼处’的理解，而不仅仅是文字描述本身。此外，考虑到个体间存在的显著差异（比如有些人天生更善于方向感），未来的系统或许应该具备个性化适配的能力，而非追求千篇一律的通用表现。

总之，这项研究提醒我们：衡量AI进步的标准不应局限于语法正确性或事实准确性，更要考察其能否体会人类复杂微妙的思维方式与社会习俗。唯有如此，人工智能才能真正成为连接机器与心灵、跨越文化与时空的桥梁，而不是又一个冰冷的数字迷宫。