Phys.org

研究人员如何利用 AI 技术使数千年前的文本变得可读。

研究人员利用 AI 技术解读数千年前的古老文本

Ludwig Maximilian University of Munich 提供

当知道我们终将一死,我们应该如何生活? 这正是世界文学的开山之作《吉尔伽美什史诗》提出的问题。四千多年前,吉尔伽美什踏上了寻求永生的道路。 与所有巴比伦文学作品一样,这部传奇史诗也只以残卷的形式流传下来。 尽管如此,自从 19 世纪被重新发现以来,学者们已经设法将该文本的三分之二恢复到可读状态。

巴比伦人将楔形文字刻在泥板上,这些泥板以无数碎片的形式保存至今。 几个世纪以来,学者们将这些粘土碎片上的文字转录到纸上。 然后,他们会仔细比较他们的转录文本,并在最好的情况下,识别出哪些碎片属于一起并填补空白。 这些文本是用苏美尔语和阿卡德语写成的,这些语言具有复杂的书写系统。 这是一项西西弗斯式的任务,也是 Electronic Babylonian Literature 项目的专家们今天难以想象的。

所有现存楔形文字泥板的数字化

来自 LMU Assyriology 研究所的 Ancient Near Eastern Literatures 教授 Enrique Jiménez 和他的团队自 2018 年以来一直致力于将所有现存的楔形文字泥板数字化。 在此期间,该项目已经处理了多达 22,000 个文本片段。

“这是一个以前不存在的工具,一个巨大的碎片数据库。我们相信它可以为重建巴比伦文学发挥重要作用,使我们能够更快地取得进展。” 这个被恰如其分地命名为 Fragmentarium 的工具,旨在利用系统的自动化方法将文本碎片拼凑在一起。 设计者希望该程序将来还能够识别和转录楔形文字的照片。 迄今为止,已与伦敦大英博物馆和巴格达伊拉克博物馆合作拍摄了数千个额外的楔形文字碎片。

算法发现新的文本并匹配碎片

该团队正在训练一种算法,以将尚未确定正确上下文的碎片拼凑在一起。 该算法已经新识别出数百份手稿和许多文本连接。 例如,在 2022 年 11 月,该软件识别出一个属于《吉尔伽美什史诗》最新泥板的碎片,其年代可追溯到公元前 130 年,这使其比已知最早的史诗版本年轻数千年。 Jiménez 评论说,在这个晚期时期人们仍在抄写吉尔伽美什史诗,这非常有趣。

2023 年 2 月,LMU 研究人员将发布 Fragmentarium。 他还将首次发布《吉尔伽美什史诗》的数字版本。 新版本将是第一个包含迄今为止所有已知楔形文字碎片转录的版本。

自该项目启动以来,全球约有 200 名学者可以使用 online platform 进行他们的研究项目。 现在它也将向公众开放。“每个人都可以使用 Fragmentarium。 还有数千个尚未识别的碎片,”Jiménez 说。

当春天来到巴比伦

Enrique Jiménez 希望一点一点地填补巴比伦文学的空白。 通过他过去几年在该项目中的工作,他不仅发现了新的文本和作者,还发现了以前未知的类型:“例如,我正在与一位伊拉克同事合作编写一篇赞美巴比伦城市的赞美诗,这是一首非常生动的赞美诗。 文本令人愉快。 你可以非常清楚地描绘这座城市。 它描述了春天如何来到巴比伦。”

欢迎订阅我们的 free newsletter,通过 Phys.org 了解科学、技术和太空领域的最新动态,每天或每周获取重大突破、创新和重要研究的最新消息。

巴比伦曾经是世界上最大的城市。 它横跨幼发拉底河,位于当今巴格达以南约 85 公里的地方。 这座古老的都会建于基督之前的第二个千年,是汉谟拉比国王的所在地,他扩大了他继承的帝国,使其从波斯湾延伸到伊拉克北部。 在公元前 7 世纪和 6 世纪之间,巴比伦经历了第二个黄金时代。 (2019 年,这座 ancient city 被宣布为联合国教科文组织世界遗产。)

(巴比伦的河流,) Araḫtu 是它的名字,(由智慧之王 Nudimmud 建造,) 灌溉牧场,浸泡芦苇丛, 将其水倒入大海和泻湖。 它的田野长出新芽, 在其草地上,闪耀着光芒,大麦涌现。 由于它的流动,成堆的谷物堆积如山, 草原长得很高,供羊群漫游和放牧。 它成倍增加,慷慨地,并向这片土地倾注 财富和辉煌——这符合人类的利益。

“以前,巴比伦文学中没有已知的城市赞美诗。 我们已经找到了该文本的 15 个新片段。 如果没有 Fragmentarium,重建过程将需要 30 年、40 年,”Jiménez 说。 他的团队还发现,该文本在课堂上发挥了重要作用,因为巴比伦小学生需要将其作为练习抄写下来。

具有永恒意义的文本

“在巴比伦文学的研究中还有很多工作要做。 我们正在发现的新文本正在帮助我们了解整个巴比伦的文学和文化,”Enrique Jiménez 说。 这位 Ancient Near Eastern 研究专家受到文本之美及其永恒意义的启发:“巴比伦人问自己的问题并非武断。 它们至今仍与我们有关。 人们总是谈论吉尔伽美什和死亡的问题。 巴比伦人试图回答它。 他们没有成功,因为这个问题没有答案。 但他们解决这个问题的事实,他们试图找到答案,仍然是有帮助的。”

在某个时候,我们建立了一个家庭,在某个时候,我们开始了一个家庭,在某个时候,兄弟们(遗产)分开了,在某个时候,土地上出现了争执。 在某个时候,河流上涨(并且)带来了洪水,蜉蝣漂浮在河上。 它的容貌凝视着太阳的脸庞,然后突然什么都没有了!

这部传奇史诗没有规范的阅读方式,它影响了世界文学数千年。“读者如何理解文本取决于他们自己,”Enrique Jiménez 说。 吉尔伽美什回到了他的家乡乌鲁克,根据现代学术研究,乌鲁克是世界历史上第一座城市。 在这一点上,叙述突然中断,文本转而枚举城市的大小及其公共广场。“吉尔伽美什回到家说,‘乌鲁克实际上是一座美丽的城市。’ 在这之下有一些更深层次的东西,”Jiménez 说。 在这种解释中,这一情节表明,尽管人们作为个体是会死的,但他们作为他们所居住的城市的一部分以及他们所属的人类社会的一部分而继续存在。

Enrique Jiménez 就在那里。 在他 LMU 办公室的架子上,一张照片显示了一个看似平坦的平原。 你必须靠近并眯起眼睛才能辨认出一条淡淡的线条,这是曾经强大的城墙的一部分。 即使是伟大的乌鲁克城,吉尔伽美什的家乡,也沦为废墟。