音乐中 Distortion 的文化演变(以及其他混合吸引力的规范)
Gregory A. Bryant Paul E. Smaldino
2025 The cultural evolution of distortion in music (and other norms of mixed appeal) Phil. Trans. R. Soc. B38020240014 http://doi.org/10.1098/rstb.2024.0014
Section
- Abstract
- 1. Introduction
- 2. Cultural evolution
- 3. Origins of the music faculty
- 4. Nonlinear phenomena in vocal communication
- 5. Nonlinear phenomena in music
- 6. A cultural evolutionary model of distortion in music
- 7. Discussion
- Ethics
- Data accessibility
- Declaration of AI use
- Authors’ contributions
- Conflict of interest declaration
- Funding
- Acknowledgements
- Footnotes
音乐中 Distortion 的文化演变(以及其他混合吸引力的规范)
Gregory A. Bryant Gregory A. Bryant https://orcid.org/0000-0002-7240-4026 Department of Communication, University of California, Los Angeles, CA 90095-1563, USA UCLA Center for Behavior, Evolution, and Culture, Los Angeles, CA, USA gabryant@ucla.edu Contribution: Conceptualization, Project administration, Writing – original draft, Writing – review and editing Google Scholar Find this author on PubMed Search for more papers by this author and Paul E. Smaldino Paul E. Smaldino https://orcid.org/0000-0002-7133-5620 Cognitive and Information Sciences, University of California, Merced, CA, USA Santa Fe Institute, Santa Fe, NM, USA Contribution: Conceptualization, Formal analysis, Methodology, Writing – original draft, Writing – review and editing Google Scholar Find this author on PubMed Search for more papers by this author Published:03 April 2025https://doi.org/10.1098/rstb.2024.0014
摘要
世界各地的音乐传统都呈现出显著的多样性,但这种变异的起源尚不清楚。音乐行为是多种能力的集合体,其中一些可能是为音乐而进化出来的,但大多数是从服务于非音乐功能的特征中衍生出来的。文化演变将这些系统缝合在一起,在不同的文化和音乐流派中产生了可变的规范实践。在这里,我们描述了音乐失真(musical distortion)的文化演变,这是一种对乐器和人声音色的嘈杂操作,它模拟了许多动物 vocal 信号中存在的非线性现象 (NLP)。我们认为,听众对 NLP 的敏感性促进了改变乐器和以失真方式唱歌的技术发展,这种失真通过群体内部协调和与其他群体区分自身的需求而持续进行文化演变。为了支持这一观点,我们提出了一个基于 Agent 的规范演变模型,该模型说明了音乐中音色失真等连续性状的可能动态,这取决于 (i) 功能最佳值,(ii) 群体内聚力和群体间差异化,以及 (iii) 群体性对分类和社会学习。这种解释说明了文化传播动力学如何导致音乐声音和流派的多样性,并为亚群区分规范的出现提供了一个更普遍的解释。
本文是“脊椎动物发声中的非线性现象:机制和交流功能”主题的一部分。
1. 介绍
关于音乐起源的问题困扰了学者们几个世纪。对世界音乐的快速调查揭示了由传统和习俗构建的各种乐器和人声,以创新的方式在无数的社会背景下体现。相对最近在音乐制作和录音中引入的电子设备,以及在发行方面的巨大创新,极大地增加了这种多样性。音乐进化理论的一个常见局限性在于,它们缺乏对我们在当代文化中观察到的令人难以置信的声音变异的解释——这个问题是因为这种变异可以说是音乐行为最有趣和最具定义的特征之一。进化解释提出了对诸如联盟信号 [1–4]、亲子沟通 [5]、社会联系 [6]、捕食者威慑 [7,8]、性信号 [9,10] 等功能的适应性解决方案,但这些因素无法详细解释巴赫合唱、南非鼓圈或不和谐的噪音无人机在何时何地出现。缺少了拼图的重要部分。
我们将音乐定义为基于声音的,有意产生的表演活动的不同类别,通常嵌入在文化环境中。在许多语言中,没有一个词可以直接映射到英语单词“music”。相反,最接近的概念通常指的是一种文化活动,其中包括一些人可能单独描述为音乐的现象。这个事实不仅揭示了这种做法在文化和时间上存在显著差异,而且也揭示了它的概念也是如此。在西方,我们已经将音乐分解为最小的组成部分——为了分析和教学的学术原因,以及与音乐创作、表演和感知相关的制作原因。通过技术,我们已经开发了对我们可以想象的每个参数进行精细控制的技术。
人类的音乐性,广义上定义为有助于音乐产生和感知的特征的集合,整合了许多不同的认知、感知和行为系统 [1,11,12]。音乐本身可以被解释为一种社会学习行为,受到规范约束,包括通过乐器和唱歌产生有意的声音。累积文化演变指导着音乐的持续表现,应该被视为解释音乐行为在历史上和跨文化中实施和变异的补充性进化分析层面。许多对音乐制作和感知很重要的专业能力都是为了非音乐的原因而进化的,大多数比人类甚至人猿还要古老。例如,支持听觉场景分析的机制允许声音流分离和定位,这与我们如何感知音乐高度相关,但在许多陆地动物中以高度保守的形式存在 [13,14]。类似地,声音信号和情感意图之间的形式-功能关系存在于哺乳动物中 [15,16],并且以清晰的方式反映在世界各地的音乐中,包括歌手的情感 vocal 表演和乐器对情感声音的模仿 [1,17–19]。但是,虽然像鸣禽和鲸鱼这样的动物在它们的信号的特定旋律特征中表达了文化变异 [20],但人类音乐的声音变化程度非常大:从柔和而缓慢到响亮而快速,从高度节奏的旋律到非节奏的无人机,从悦耳到失真。这种变异的来源是什么?
我们提出,这种声音和风格的许多变异可以通过诉诸于集体围绕特定文化活动组织和协调的需求,以及其成员将自己与其他群体区分开来的需求之间的紧张关系来解释。前者的动态可能受到某些声音在唤起对特定活动有益的反应方面的效用的影响,而后者的动态在大型、多样化的人口(例如 WEIRD)中尤其重要,并且可能有助于解释不同音乐亚流派的持续适应性辐射。在本文的其余部分,我们将充实我们的论点,并提出一个简单的文化传播动力学形式模型,该模型在理论上可以应用于任何对音乐制作不是绝对必要的并且可以具有混合审美吸引力的音乐特征。虽然我们专注于音乐(特别是音乐失真),但我们的模型实际上更普遍,适用于范围广泛的规范行为的文化演变,包括音乐和非音乐。从长远来看,群体身份、技术和规范信号以及联盟建设实践的文化共同演变可以产生群体实践,其风格既能团结群体成员,又能阻止或迷惑外人。
在这里,我们的模型旨在描述音乐的任何方面,这些方面在不同的传统中会发生变化。一个例子是音乐失真(包括模糊、粗糙和其他频谱噪声),它广泛出现在工业化人口的音乐中,尤其是在摇滚和相关流派中,但它也零星地和不同地出现在跨文化和时间的音乐中。失真在技术上可以定义为声波的渐进式过渡(对于电吉他,为三角波),被认为是相对“干净”的,根据振幅增益而变成方波 ([21];参见图 1A)。
图 1. 音乐失真示例。(A) 上图:单声道波形和窄带快速傅里叶变换 (FFT) 频谱图(50 毫秒高斯分析窗口,44.1 kHz 采样率和 0-15 kHz 频率范围)的单个拨动电吉他弦(E:82.4 Hz)干净和失真(Analogman 的 King of Tone 踏板,失真模式)。下图:从每个 500 毫秒处截取的 30 毫秒片段。(B) 上图:立体声波形和窄带 FFT 频谱图(50 毫秒高斯分析窗口,44.1 kHz 采样率和 0-15 kHz 频率范围)记录于 1996 年的 Merzbow 的“Woodpecker No. 1”,展示了一个 6 分钟的无调性噪音作品,缺乏可辨别的节奏和旋律。下图:在近似一半标记(3:20)处截取的 30 毫秒片段。
这种非线性过程 [22] 通常会导致周期性降低,同时保留音高、组合音,并且在极端水平下会导致无调性宽带噪声(图 1B)。模拟电路和数字算法可以通过剪切、压缩和过滤声波以无限的方式影响转换,这可以引入高次谐波并允许声音设计师创建提供各种音乐特征的音色调色板。我们认为,音乐中的这类失真现象受到了感知吸引子的文化塑造,即所谓的非线性现象 (NLP;详见下文)。音乐失真会触发为检测通过 NLP 发出信号的社会代理人的声音中的强烈情感而进化的机制。反过来,音乐中的失真特征已通过文化选择并得到显著改进,以便在不一定反映任何可靠生理相关性的环境中生成;也就是说,它们通常不是真实体现的唤醒的索引,而是有意且通常是诚实的审美偏好信号。音乐中产生的失真声音特征受到了文化进化力量的塑造,不仅可以增强乐器和人声的声音,还可以区分流派亚文化和参与其中的 Agent。在以下各节中,我们将描述 (i) 文化演变的相关原则,(ii) 一种文化演变方法,用于理解音乐能力,(iii) 发声中的 NLP 背景和音乐中的失真,以及 (iv) 一个基于 Agent 的文化特征演变模型,着眼于音乐失真的扩散。
2. 文化演变
文化演变是一个丰富的、形式化的理论框架,用于理解文化稳定和变化 [23–25]。该领域将达尔文自然选择的原则扩展到包括行为、思想和技术的社会学习和文化继承,并在过去四十年中开发了经经验支持的正式的信息传播、合作、规范、身份信号、群体间竞争等理论。在理解人类文化方面,尤其重要的是我们累积文化演变的能力——在世代时间内改进、扩展和重组技术和文化创新的群体层面能力 [26–28]。此外,许多这些文化创新是集体行为,涉及众多个人的规范协调。音乐就是这样一种创新。因此,适应性优势不仅源于与环境的适应性互动,而且还源于有效合作的能力,从而产生只有群体才能产生的协同效益 [26,29]。
文化演变之所以成为可能,是因为人类心理学允许特征通过基因传递之外的第二种渠道进行传递:社会学习。事实上,该领域的开创性工作旨在了解什么样的学习心理学可以通过自然选择来塑造,以允许适应性文化传递 [23],并且已经确定了范围广泛的社会学习策略,这些策略提高了社会信息的适应性价值 [30]。优先地,从成功或高声望的个人那里学习通常是维持群体中有用技能的有效方法,但如果这些信息来自与自己截然不同的环境中的某个人,则多样性会限制该信息的适应性价值。在这种情况下,群体身份的信号可以将一个人的注意力引向最可能有用信息来源,尤其是在身份信息与有关成功或声望的信息相结合时 [31]。表明群体身份的信号,包括当代工业化社会中音乐亚文化的指标,是文化演变的关键驱动因素,促进了群体内部的协调并加强了群体之间的差异化 [32–34]。明确的群体边界是合作和有效管理集体资源的众所周知的驱动因素 [35]。
音乐失真的文化演变至少利用了三个促成行为社会传递的因素。第一个是捕捉进化而来的人类心理学的注意力和审美吸引力。音乐与许多生理和心理过程有关,如果它没有促进比不适应性行为更频繁的适应性行为,就不会持久。当地社会生态学也将在塑造音乐的最佳方面发挥作用。音乐声音特征与情感反应和可能的后续行为反应之间存在形式-功能关系 [1]。例如,快速节奏与音乐失真相结合,在诱导强烈的情绪反应和身体运动(例如,猛烈跳舞)方面特别有效,而摇篮曲例如不应具有这些属性,因为唱歌给儿童的交流功能 [36]。因此,与人类心理学和当地生态的需求更好地契合的音乐方面将导致更大的成功和更广泛的采用。第二个是与他人协调的需求。只有当社区成员就音乐的制作和参与方式达成一致时,音乐才能为互动性、联盟建设和联盟信号提供益处。因此,符合社区规范的音乐方面将导致更大的成功和更广泛的采用。第三个是通过将一个群体的规范与另一个群体的规范区分开来,从而加强群体边界的需求。音乐通过帮助划分群体承诺和效忠关系来发挥信号和协调功能。在这种情况下,失真可能特别受益于其粗糙的声音特征——未融入包含失真的群体音乐中的个人可能难以从参与中受益。
3. 音乐能力起源
世界范围内的音乐几乎没有例外地具有两个主要特征:节奏和旋律。节奏包括提供节拍的听觉事件——通常在重复和稳定的时间间隔内是等时的——并且通常具有重音元素(即强和弱节拍)。旋律最一般地是指音调等级内的音高调制。总之,这两个特征表征了结构化的音乐行为,但音乐的许多其他组成部分是特定于给定的地点和时间的,包括乐器、制作方法、社会功能等等。音乐活动中这些可变出现的特征为了解更普遍地构成音乐的潜在生物学和文化机制提供了一个窗口 [36,37]。
如上所述,特定的音乐特征通常可以归因于解决音乐领域之外的经常性适应性问题的认知、感知或行为适应。例如,语言和语音系统可能构成了音乐传统的许多方面,例如节奏和旋律中的分层结构、可移调性和生成性 [11,38],以及歌词演唱和书面音乐符号中的明显作用。大量证据表明声音感知机制产生了音乐音阶 [39]、大小调模式 [40]、谐和与不谐和 [41,42] 和音乐间隔 [43–45]。生物力学系统为乐器的构造和使用提供了 [46],记忆系统允许学习用于重复表演和文化传播的音乐作品。这些只是多组件机制与世界各地音乐的广泛特征之间合理联系的一些例子。
但是也有理论上的理由来假设存在特定于音乐的机制。例如,允许社会夹带(即独立 Agent 之间共享的时空、基于运动的协调)的行动-感知耦合与群体协调信号的定制密切相关,这是一种独特的物种特定行为 [1–4,7,47]。婴儿定向旋律的产生和感知也可以被认为是基于音乐的信号系统,解决了看护人-婴儿沟通的问题 [3,5,48]。
无论音乐能力中任何机制的起源如何,所有音乐特征都受到文化演变力量的影响。此外,累积文化的迭代性质可以产生高度夸张的形式,类似于表征塑造动物信号系统设计的共同进化过程的仪式化 [49]。我们在本文中的重点示例是音乐失真的文化演变。虽然失真目前可以通过多种方式产生——使用包括放大器、效果踏板、合成器、扩音器和计算机软件在内的工具——但它可能源于人声中的 NLP,并且通过累积文化已经演变为各种各样的混乱声音现象。
4. 人声交流中的非线性现象
NLP 广泛出现在跨物种的 vocal 行为中。理论家已经将各种各样的声学现象描述为非线性,包括次谐波、谐波边带、双音和快速音高变化 [50]。所有这些复杂的特征都出现在人类声音中,并且可能与音乐相关。但在这里,我们关注有时在 vocal 文献中被称为“确定性混沌”的现象类别,其中该术语的使用范围比物理学和复杂系统文献中更窄(例如 [51])。在这种情况下,确定性混沌可以定义为宽带状噪声,这是由于声带设备中的混沌振动状态产生非周期性波。值得注意的是,vocal 产生的所有方面都受到非线性动力学的影响,包括从静止状态到产生声音模式的过渡。但是,与普通控制的稳定动力学的偏差通常会导致具有感知、交流和适应性后果的不同生产模式。同样重要的是要注意,音乐失真通常不是通过混沌过程产生的(在自然 vocal 产生之外),而是通过各种技术(例如,波形整形、合成、放大等)来模拟音乐中相关的失真声音。我们感兴趣的是这些现象,特别是它们充当文化选择目标的能力。
主观上,vocal 中的确定性混沌具有失真的、刺耳的声音,类似于宽带噪声,并且在频谱图中显示为跨越频率频谱广泛分布的能量。由于过多的能量被迫通过声门和 vocal 管道,vocal 系统中的混沌振动状态可能会产生。在高度唤醒的行为环境中,动物(包括人类)会产生高能量的 vocal,从而产生失真的咆哮、喊叫或咆哮。这些声学特征允许接收者提取重要的行为和生态信息,并且随着时间的推移,导致了适应性的感知反应。如果动物正在经历高度唤醒,那么其他人必须认识到它并采取相应的行动,例如准备攻击、响应警报或表达屈服。
一些非线性可能已经被仪式化成信号的极其显著的属性。NLP 具有特别有效吸引他人注意力并且难以习惯的特征(例如 [52])。这些属性使 NLP 具有重要的交流效果,使其成为交流系统中选择的目标 [50]。例子比比皆是,但可以考虑 NLP 在人类婴儿哭声中的作用。婴儿哭泣背后高度唤醒表现为哭泣 vocal 中高能量输出 [53]。婴儿哭泣的原因有很多,大多数与引起看护人的注意并影响他们提供基本需求有关。哭泣受到感知厌恶的选择的塑造,这促使看护人采取行动使其停止,不同的声学属性表明需求的严重程度 [54]。哭泣中的混沌元素诚实地反映了高度负面唤醒,并且声音本身听起来特别令人不愉快,为选择作用于 vocal 特征以进一步增强其效果提供了基础。通常,接收者受到发送者操纵是最佳利益(特别是当他们是近亲时;[55]),并且选择物理形式是因为它们可靠的交流功能。
Vocal 交流在大多数音乐传统中都扮演着重要的角色。除了唱歌之外,许多乐器在某种程度上模仿声音,具有相似的频谱输出并结合了捕捉 vocal 行为方面的微妙效果。Vocal 信号对于音乐的重要性也体现在 vocal 学习对于节奏夹带演变的作用中 [56]。能够单独地以及以与其他人的协调方式控制声音可能是音乐演变起步的最重要因素,从而促进了群体层面的活动。这种能力合理地为文化演变的力量奠定了基础,并导致了协调一致的基于声音的传统中显着的变化。
5. 音乐中的非线性现象
对音乐中各种类型噪音和不和谐的主观意识长期以来一直吸引着感知心理学家、音乐学家、计算机科学家和行为生物学家。例如,Helmholtz [57] 对人们在谐和和不谐和音乐间隔中对粗糙度的感知进行了早期的心理声学研究,并对导致粗糙度判断的生理因素以及如何使用这些特征进行音乐表达和文化变化进行了有先见之明的评论。鉴于 NLP 在人类 vocal 中普遍存在且显着,我们应该期望它们出现在音乐文化中。事实上,我们可以在唱歌传统中找到各种各样的 NLP。例如,中国歌剧中的“京”角色(即一个有力的男性角色)的特征是咆哮般的品质。Tsai et al. [58] 描述了京剧风格,并明确