2025年5月9日 4 分钟阅读

语言学家发现曾被认为是“骗局”的语言模式的证据

语言学家发现,Inuit 语确实有很多关于雪的词汇,其他语言也有概念上的特殊性,这可能揭示了一种文化的价值观。

作者:Cody Cottier 编辑:Allison Parshall

Open dictionary on black background

Stella/Getty Images

1884年,人类学家 Franz Boas 从 Baffin Island 返回,带回了一个发现,引发了数十年的语言学争论:据他统计,当地的 Inuit 语有四个关于雪的词,这表明了 语言和物理环境 之间存在联系。 经过口口相传,这个数字被夸大,直到 1984 年,《New York Times》发表了 一篇社论,声称 Inuit 人对我们用一个词概括的白色冰冻物质有“100个同义词”。

Boas 的观察结果已经膨胀到神话般的程度。 在 1991 年的一篇文章 中,英国语言学家 Geoff Pullum 称这些说法是“骗局”,他引用了语言学家 Laura Martin 的研究,后者追踪了虚假信息的演变。 他将其比作电影《Alien》中的 xenomorph,一种“一旦在宇宙飞船上放出来,似乎无处不在,而且很难杀死”的生物。 宾夕法尼亚大学的汉语专家 Victor Mair 说,他尖刻的批评使这个话题成为一代人的禁忌。 但现在,他说,“它正在以一种合法的方式回归。”

在一项对世界语言进行的大规模新计算分析中,研究人员不仅证实了 Inuit 语 Inuktitut 中对雪的强调,而且还 发现了许多类似的模式:雪对于 Inuit 人来说是什么,熔岩对于萨摩亚人来说是什么,燕麦粥对于苏格兰人来说是什么。 研究结果发表在四月份的《Proceedings of the National Academy of Sciences USA》上。 澳大利亚墨尔本大学的计算心理学家、该研究的资深作者 Charles Kemp 表示,研究结果为了解 语言使用者的文化 提供了一个窗口。 他引用 Boas 的话说:“这是一种了解‘一个民族的主要兴趣’——对一个社会来说什么是重要的,他们优先考虑和重视什么的方式。”

研究人员分析了英语和 600 多种语言之间的双语词典,寻找他们所谓的“词汇扩展”,即一种语言有许多与核心概念相关的词。 这也是引发 Inuit 辩论的相同现象。 但这项研究带来了一个转折:它没有测量单词的 数量,而是测量了它们的 比例,即一个概念占据的词典空间。 这产生了数百个概念的扩展分数,从“遗弃”到“动物园”,基于这些概念的英语单词在外语单词的定义中出现的次数。 您可以在 这个在线模块 中探索结果,该模块显示了哪些语言对每个概念的词汇最多,以及哪些概念在每种语言中的词汇最多。

Three maps show the languages with the top scores for the concepts of smell, dance and snow, respectively, based on the proportion of dictionary entries that mention the concept. They also show the top terms that share a similar distribution for each concept.

Ripley Cleghorn; Source: “A computational analysis of lexical elaboration across languages,” by Temuulen Khishigsuren et al., in Proceedings of the National Academy of Sciences USA, Vol. 122, No. 15; April 15, 2025

通常,这种扩展显然是环境的产物——毫不奇怪,阿拉伯语、波斯语和澳大利亚土著语言中充斥着描述沙漠的词汇,梵语、泰米尔语和泰语中充斥着描述大象的词汇。 其他情况则不那么简单。 例如,许多 Oceanic 语言都有非常具体的关于气味的词汇。 在 Marshallese 语中,meļļā 的意思是“血腥味”,jatbo 的意思是“潮湿衣服的气味”。 这可能是由于热带雨林的湿度放大了气味造成的。 但是,为什么狂喜的概念在葡萄牙语中如此突出,而痛苦的概念在印地语中如此突出? 什么样的历史和文化环境引导一种语言走上如此晦涩的道路? “我不确定是否有人知道,”Kemp 说。

Mair 说,这项研究(他在流行的语言学博客 Language Log 上强调了这一点)有助于恢复长期以来被诋毁的语言相对论思想,有时被称为 Sapir-Whorf hypothesis。 在最激进的情况下,语言相对论断言语言决定了我们如何感知事物,导致不同语言的使用者以截然不同的方式体验世界(想想电影《Arrival》,其中一个角色在学习了一门外星语言后变得有预知能力)。 但在 Mair 看来,这项研究支持了一种较为温和的说法:我们的大脑都共享相同的基本机制来感知世界,语言可以微妙地影响但不能限制这种机制。 “它不决定,”他说。“它会影响。”

同样,英国 Sussex 大学语言学家 Lynne Murphy(未参与此项研究)指出,“任何语言都应该能够谈论任何事情。” 我们可能没有 Marshallese 语单词 jatbo,但四个英语单词就可以做到——“潮湿衣服的气味”。 拥有许多关于气味的精确词汇并不是揭示了处理气味的惊人认知能力; 仅仅是单个词比短语更有效率,因此它们倾向于代表常见的讨论主题,突出文化意义的领域。 如果我们需要经常谈论潮湿衣服的气味,我们会将这个笨拙的短语缩减为类似 jatbo 的东西。

不过,研究的主要作者,墨尔本大学的博士候选人 Temuulen Khishigsuren 说,“仅凭词汇的扩展无法告诉我们使用者的文化”,至少不确定。 而且,由于此分析基于词典,因此它带有编写词典的词典编纂者的偏见和局限性。 正如 Murphy 所说,它们“只提供了在特定时间从特定角度对一种语言的快照”。 使用的一些词典已有数十年或数百年历史,它们可能反映了殖民者的古老担忧——翻译圣经或建立贸易路线——就像反映了现代使用者的担忧一样。 像德语或梵语这样的大型书面语言的词典比那些仅口头使用的语言的词典大得多,并且充满了深奥的术语。

由于词典不能代表人们在现实世界中使用语言的方式,因此下一步将是衡量人们实际谈论或书写所研究概念(例如雪、气味和大象)的频率。 这对于没有大量书面文本的语言来说很困难,但对于许多语言来说是可能的,尤其是那些在社交媒体上大量使用的语言。

值得记住的是,这些词汇扩展来自语言之间的比较——法语之所以有“许多”关于徒劳的词汇,仅仅是因为其他语言的词汇较少。 而且,由于本研究中的所有双语词典都映射回英语——英语是一切其他语言都被翻译成的语言——因此该分析受到英语本身使用的词汇的影响。 如果我们发现其他语言的扩展模式不寻常,那么可以肯定地认为,他们的使用者也会以同样的方式回报。 “英语与其他任何语言一样‘不同’,”Murphy 说,这提出了一个问题:“如果我们从西班牙语、汉语或马拉雅拉姆语开始,哪些概念对英语来说会脱颖而出?”