有条不紊的平庸：类比 LLM 的写作自动化

Methodical Banality

Source | HN Comments

文章探讨了文艺复兴时期人文主义者写作的自动化，类比于现代大型语言模型（LLMs）。作者指出，Erasmus的人文主义教育培养了快速写作能力，但牺牲了新颖性，类似于LLMs生成文本的模式。Rabelais观察到，这种自动化可能导致语言的社会力量减弱，无法有效沟通。文章分析了人文主义者在处理冲突时的失败，以及语言自动化带来的局限性，强调了沟通需要考虑听众的实际反应，而非仅仅追求语言的流畅性。

有条不紊的平庸

就像今天的大型语言模型一样，16世纪的人文主义者也掌握了自动化写作的技术——但却以牺牲新颖性为代价

by Hannah Katznelson + BIO

Illustration by Gustave Doré (1832-83) for the novel Gargantua by François Rabelais. Photo by Getty Images

Hannah Katznelson 是加州大学伯克利分校比较文学系的博士候选人，也是文艺复兴和早期现代研究指定重点项目的成员。

Edited by Marina Benjamin

文艺复兴时期的学者和教育家 Erasmus of Rotterdam 在他的辩论性论文 The Ciceronian (1528) 的开头，描述了一个名叫 Nosoponus 的角色完全失调的写作过程。 The Ciceronian 的结构是一场对话，两位成熟的作家 Bulephorus 和 Hypologus 试图劝说 Nosoponus 摆脱他对文体完美的麻痹性痴迷。 Nosoponus 解释说，他需要花费数周徒劳的写作和重写才能写出一封随意的信，要求朋友归还一些借来的书。他说，写作需要如此高度的集中，以至于他只能在晚上，当没有其他人醒来分散他的注意力时才能进行写作，即便如此，他的完美主义也如此强烈，以至于一句话就成了一个整夜的工作。 Nosoponus 一遍又一遍地检查他写的东西，但仍然对他的语言质量如此不满意，以至于最终他放弃了。

Painting of a man in a black hat writing in a book with a quill against a green background.

Portrait of Erasmus of Rotterdam Writing (1523) by Hans Holbein. Courtesy the Kunstmuseum Basel

Nosoponus 的问题可能会引起共鸣。谁没有花太长时间来仔细推敲一封简单的电子邮件的措辞呢？今天，有一个简单的解决方案：我们有大型语言模型 (LLMs) 为我们写信，并提供有用的建议，告诉我们该说些什么，以及该如何措辞。当我将 Nosoponus 的意图请求输入 GPT-4 时，它几乎立即生成了以下内容：

Hey [Friend’s Name],

Hope you’re doing well! I just realised I never got those books back that I lent you a while ago. No rush, but whenever you get a chance, I’d love to get them back. Let me know what works for you! Thanks!

Nosoponus

但在 16 世纪也有一个解决方案。 Erasmus 式的人文主义教育可以培养学生快速、轻松、雄辩地创作任何长度、任何主题的信件。法国人文主义者 François Rabelais 是 Erasmus 的同时代人，他似乎理解这些写作技巧，认为它们以一种回顾性的方式自动生成文本，看起来很像 LLMs 的运作方式。如果我们想了解 LLMs，以及它们能够做什么和不能做什么，我们可以看看相同技术的早期版本——比如 Erasmus 式的人文主义。我们还可以阅读像 Rabelais 这样的作者，他已经在沿着这些思路思考自动文本生成，他既欣赏 Erasmus 生成技术的有效性，但同时也认为它会削弱语言的社会力量，并最终破坏语言作为道德和政治生活的工具。

Rabelais 是一名僧侣、医生、私人秘书和间谍，但今天他主要以其关于 Gargantua 和 Pantagruel 的五部分文学小说而闻名，这是一个（字面意义上的）贵族巨人家庭，他们在 16 世纪的法国生活中穿梭，同时又比其他所有人都大得多。他在该系列的第二本书 Gargantua (1534) 中，主要关注人文主义教育的优势和成本。那些接受过人文主义训练的角色会产生独特而精妙的语言，但是当他们说话或写作时，他们主要是在传达他们接受了多么棒的教育，而不是他们实际上要表达的内容。当我们阅读这样的句子时：“在人类之间，最没有理由感到痛苦的事情莫过于，他们本应在公正的期望中获得友善的恩惠，却受到了折磨和伤害”（我自己的 Rabelais 翻译）——或者采用现代聊天机器人的等价物：“当那些受托照顾或尊重我们的人反而让我们遭受虐待时，这真是令人沮丧”（GPT-4）——我们更有可能对作者或生成它的语言模型的语言能力印象深刻，而不是反思有人应该善待你却对你不好这件事。

Erasmus 和 Nosoponus 都在用拉丁语写作，像任何人文主义者一样，他们通过费力地模仿古代伟大的拉丁作家来学习拉丁语（尽管试图用第二语言来匹配他们的母语流利性和口才存在根本性的困难）。文艺复兴时期的知识分子就他们应该模仿_谁的_拉丁语争论不休，尽管他们的实际分歧很小。 Cicero 是被选中的抄写员。他作为古代最佳散文家的地位无可争议。因此，主要的争论是在 Ciceronians 之间，他们相信模仿他们的英雄而排除所有其他模型；以及折衷主义者，他们相信模仿 Cicero _以及_其他模型。 Erasmus 是一位折衷主义者。在 The Ciceronian 的过程中，他的作者代表 Bulephorus 逐渐说服了 Nosoponus，即名义上的 Ciceronian，转向折衷主义的一方。要理解他提出的论点，以及 Nosoponus 转变所涉及的利害关系，你需要了解人文主义文体模仿是如何运作的。

人文主义者反复阅读他们想要听起来像的古典作家——这与 LLM 在语料库上训练的方式没有什么不同。他们尽可能地内化了他们所模仿的模型的散文品质，并且还在一种叫做“commonplace book”的东西中保留了一种口头上的未雨绸缪基金，也就是说，当他们阅读时，他们抄录了大量突出的单词、隐喻、短语和陈词滥调——通常按主题组织——然后在写作时加以利用。折衷主义的作者会收集许多不同作者和流派的亮点，但 Ciceronian 只会从 Cicero 那里复制。因此，使用“commonplace book”写作将使折衷主义者能够利用他更广泛的阅读范围，从而使他自己的散文更具多功能性，而 Ciceronian 的风格只会变得更加同质化。 Bulephorus 指出，Cicero 本人也在他的同时代人中广泛阅读：他认为，如果 Cicero 今天还活着，他会制作出适合现代世界的文本，因此与现存的 Cicero 语料库中的任何内容都截然不同。换句话说，Cicero 将成为一位折衷主义者。

但是 The Ciceronian 明确指出，Ciceronians 和折衷主义者不仅在他们的“commonplace book”的内容上有所不同，而且在使用它们的方式上也有所不同。对于折衷主义者来说，它们是一种安全网：如果 Bulephorus 想不出合适的词，他可以查阅他的书，就像我们查阅词库一样，从而节省了所有他原本会花在自己想办法上的时间。然而，对于严格的 Ciceronian 来说，“commonplace book”更像是一个安全检查站。 Nosoponus 在没有帮助的情况下生成语言，但感到有义务费力地验证他想要在“commonplace book”中使用的每个单词或结构的 Cicero 来源，这实际上已经成为 Cicero 语料库的详尽索引。这种坚持保持对写作过程的有意识的、执行的控制，使得他不可能实现写作的流畅性，以至于他拒绝在没有首先确定 Cicero 是否使用了他需要的任何特定的屈折形式的情况下，变位他的动词。难怪一句话就是一个整夜的工作。

这封信和演讲听起来不错，但它们相当长而且乏味：它们有些平庸

Erasmus 作为一名教师的目标是培养他的学生拥有 Nosoponus 所缺乏的那种流利性。他通过给他的学生提供需要微妙的修辞处理的虚构或历史场景——就像我们今天提示 LLM 一样——让他们“以角色”创作信件或演讲。例如，他们可能会写一封从巴黎寄给 Helen 的情书，或者他们可能会以 Agamemnon 的身份写信，召唤他的盟友对特洛伊发动战争，或者恳求 Menelaus 忘记 Helen 并避免这场战争的可怕的人员伤亡。他们可以写 Menelaus 辱骂 Paris 偷走了他的妻子，或者原谅 Helen 离开了他。（Erasmus 在他的教学手册 On the Writing of Letters 中给出了大量的例子，包括其中的许多例子。）

A painting of a man with a beard wearing a black hat and fur-trimmed robe, set against a dark background.

Portrait of François Rabelais by Okänd. Courtesy the National Museum, Stockholm

当 Rabelais 的人文主义角色最终有机会将他们的训练付诸实践——试图避免与他们的邻居 Picrochole 发生战争——他们创作的文本读起来就像 Erasmus 的课堂练习。巨人 Grandgousier 给他的儿子 Gargantua 写了一封信，召唤他回来保卫家族土地，抵抗他好战的邻居 Picrochole。与此同时，Grandgousier 的大使 Ulrich Gallet 也发表了一篇反战演说，敦促 Picrochole 停止他的侵略。 Rabelais 完整地给出了这封信和演讲的文本。它们听起来不错，但它们相当长而且相当乏味：它们有些平庸。它们也同样可以由文艺复兴时期的学童在这些场景的提示下制作出来，或者由 LLMs 模拟它们。

它们也_不起作用_。 Grandgousier 和 Gallet 可能会谴责战争的恐怖，坚持避免战争的道义义务，但演讲和信件实际上加速了暴力，而不是阻止它。它们未能实现和平，因为它们过于平庸。

无论是通过 Erasmus 学派还是 LLMs 实现的语言自动化，都取决于拒绝新颖性：两者都以相同的方式运作，将表面上新的情况和主题分解为熟悉的元素，以便可以使用与训练语料库中这些元素已经关联的语言来解决这些情况。对于 Grandgousier 和 Gallet 来说，这意味着使他们能够如此出色地说话的人文主义心态也使他们以某种傲慢的态度对待冲突——假设他们可以根据他们已经阅读的内容来预测对方可能提出的任何说法。

事实上，他们困境的讽刺之处在于，Rabelais 的人文主义角色喋喋不休地谈论与 Picrochole 建立对话的必要性，但他们用表达倾听他的观点的重要性的语言阻止了对话的发生。这是一种语言，不是橄榄枝，而是盾牌。

Grandgousier 写信给 Gargantua 说：“我已经多次友好地派人去 [Picrochole] 那里，了解他觉得自己以何种方式、被谁、以及以何种方式受到了委屈，但我没有收到他的任何回应，只有故意的蔑视。” 但这不是真的。 Grandgousier 只派了他的大使去 Picrochole 那里一次，而不是多次——而且时间也足够近，Gallet 不可能已经到达他那里，更不用说带着回应回来了。

'unicorn' 和 'raccoon' 出现在不同语境中的原因是浣熊确实存在

也许 Grandgousier 在撒谎，因为他没有真正兴趣避免战争，这封信只是为了建立地缘政治道德制高点的书面证据。但是，如果我们不把他说谎的行为看作是谎言，而是看作更接近大型语言模型的所谓“幻觉”呢？

LLM 会根据提示，以文本回应，它“认为”该文本在该提示建立的上下文中可能是合理的或适当的。因为它对上下文非常敏感，所以如果我要求一个童话故事，它会告诉我关于 unicorns 的故事，但如果我问关于北美野生动物的问题，它就不会告诉我 unicorns 的故事——但这并不意味着它对现实或对某事物的真实性有内在的表述（当然，当被提示时，它可以生成描述这种表述的文本）。它并不“理解”像 'unicorn' 和 'raccoon' 这样的词出现在不同种类的语境中的原因是浣熊确实存在。只要我们要求 LLMs 提供常见且一致的信息，例如一茶匙有多少茶勺，这都没问题。但是，当我们要求一些晦涩或高度细致的信息时，他们可能会编造一些看起来合理的答案——例如 fake 法律先例（其中 LLM 的表现不比随机猜测好），或者一支拥有来自错误球队的球员的 NBA 阵容。

Grandgousier 可能也在发生类似的事情，他可能以同样的方式扮演一个善良的基督教人文主义王子的角色，LLM 扮演用户分配给它的人格角色，作为一种话语和修辞特征的集合。毕竟，他正在处理 Erasmus 道德教诲中的一个直接场景：我们知道他“应该”不惜一切代价避免战争，因为我们已经阅读了 Erasmus 广泛的反战著作。并且，确实，他的信中说出了我们或他可能普遍期望从处于他这种情况下的一个有德王子那里听到的一切（或者从一个想象自己是王子的 Erasmus 学童那里听到的一切）。因此，当 Grandgousier 从事高度训练和半自动的创作过程时，他可能会由于一种话语反身而写出不真实的东西——其运作方式不是与真理相反，而是_与真理无关_——再次像一个 LLM，它只是通过说出基于其训练的内容，它期望它的用户期望它说的东西来近似于现实。

回想一下 Erasmus 反对 Cicero 主义的论点，即没有一个作者可以为每一种可能的话语情境提供通用和语言资源。但是，Erasmus 的折衷主义和他所讽刺的严格的 Cicero 主义之间的区别是程度上的，而不是种类上的区别。在这两种模式下，人文主义者只能在他从预定义的语料库中提取的工具允许他的范围内适应新颖性。但是，由于折衷语料库比 Cicero 语料库更大、更多样化，因此其局限性更为微妙——而 LLMs 则更加微妙，因为它们是在比任何一个都大得多的语料库上进行训练的。然而，Rabelais 的人文主义者表现出与当今 LLM 用户完全相同的唯我论，他们“与” LLMs 思考时，只是通过其他人所说的话来折射他们自己的想法。

这没有什么问题，但这不是交流

这封信和外交演讲在定义上都是交际性的体裁：它们的存在是为了对它们所针对的特定对象产生直接影响。相比之下，Erasmus 的学生所写的信是教学练习，只有指导者才会阅读。 Gallet 的外交使团失败了，因为他将其视为一种练习。尽管他被派去了解 Picrochole 的说法，但他只是通过一系列修辞问题来_模拟_尝试这样做：“那么，是什么疯狂驱使着你现在……？信仰在哪里？法律在哪里？理性在哪里？人性在哪里？对上帝的恐惧在哪里？” 有点讽刺的是，他后来斥责 Picrochole 未能通过对话来缓解冲突，就像他自己未能做到的一样：“如果有些错误可能是我们造成的……你首先应该询问事实真相，然后为此斥责我们。”

这使我们认识到自主语言的唯我论的另一个后果，即英国哲学家 J L Austin 在 20 世纪 50 年代称之为它的言语行为力的退化——也就是说，某人说了某事意味着什么，而不是他们实际所说的话（即语词行为）。 LLM 语言的言语行为功能受到损害，最直接的原因是，没有一个单独的社会主体在说话：LLM 无法结婚、打赌或为船只命名（以 Austin 的例子为例）。但是，即使一个人使用 LLM 生成语言发送给另一个人，也会丧失对相关语言的社会所有权——就像大使一样，被派去代表某人向某人讲话。

Gallet 在启动他的话语时，没有考虑到它对其受众产生的实际影响

Gallet 的使团失败了，因为他对他的语言的实用维度视而不见。他的演讲极具侵略性和侮辱性。他将 Grandgousier 之前与 Picrochole 的联盟描述为“神圣的友谊”；告诉 Picrochole，他的军事侵略表明“对于那些已经从上帝和理性中解放出来，以便遵循他们邪恶的倾向的人来说，没有什么神圣或神圣的”；说他的行为“远远超出了理性的范围，对普遍的感情如此令人反感，以至于人类的理解几乎无法理解它。” 然而，如果我们将 Gallet 的使团视为一种社会行动——这显然是深受冒犯的 Picrochole 对它的看法——那么它明确地表明了一种战争的愿望，即使其外延内容是和平主义的。我们可以用两种不同的方式来理解这种语调不匹配。这可能是 Gallet 狡猾地试图在保持受害者形象的同时升级战争。但是，Gallet 也可能只是未能考虑到他的演讲的言语行为力，他将其视为一种关于战争罪恶的通用修辞练习，而不是一种具有交际性的外交行动。

从所有这些中可以得出一个简单的道德教训。如果我们希望遇到“他者”——并与他达成和平——我们必须避免 Gallet 的例子，他在启动他的话语时，没有考虑到它对其受众产生的实际影响。我们应该模仿 Picrochole 本人，他不是用演讲而是用问题来迎接 Gallet：“你要说什么？”

通过围绕一系列人文主义者未能提问和倾听来构建战争的爆发，Rabelais 既将这些失败描述为道德上的失败，又将它们定位在限制 Erasmus 修辞训练的认知结构中。指责是：Erasmus 为他的学生提供了一种将语言作为目的本身来产生的技术，但他没有教他们如何交流。 Rabelais 向我们展示了，当话语的产生自动化时，它会变得严格的独白，并失去其言语行为的社会力量。这种自主语言就像一位大使：它为我们说话，但它不能像我们一样说话。