[中文正文内容]

楔形文字:研究人员的新数字工具 从楔形文字到代码:在2024年于 Boğazköy-Hattuša 发现的西台语楔形文字文本的节选(照片和XML文本)。Credit: Daniel Schwemer, University of Wuerzburg

位于土耳其北部的 Boğazköy-Hattuša 是联合国教科文组织世界遗产。它曾经是西台帝国(Hittite Empire)的首都,西台帝国是公元前1650年至1200年左右青铜时代晚期的一个大国。

在那里和其他西台遗址发现的楔形文字泥板(cuneiform tablets)是古代近东最大的文本群之一。它们包括数千种西台语(Hittite)来源的文本,西台语是一种早期得到证明的印欧语系语言,以及许多其他安纳托利亚语、苏美尔语、阿卡德语和胡里安语文本的片段。

自2023年以来,一种创新的数字工具一直在为研究人员和学生提供对这些历史资料的在线访问: Thesaurus Linguarum Hethaeorum Digitalis (TLHdig 0.1),该工具在 Hethitologie-Portal Mainz platform (HPM) 上发布。 自首次发布以来,这个词库已成为西台学者每天使用的数字工具之一,每月访问量超过10万次。

该工具的扩展以及许多新选项

这个工具现在更加强大:作为 TLHdig 0.2,它包含超过 98% 的已发布来源——大约 22,000 个 XML 文本文件,其中许多文件由多个重新连接的片段组成。 目前,该语料库包含近 400,000 行音译文本。但这还不是全部:预计将于 2025 年底发布的 TLHdig 1.0 将提供对所有已发布文本的完整覆盖。

研究人员可以浏览和搜索音译或楔形文字文本,并应用各种过滤器进行更复杂的查询。 TLHdig 嵌入在 Hethitologie-Portal Mainz 的基础设施中,并与各种数字目录工具、媒体数据库和文本版本集成。

用于新文本出版的在线流程

TLHdig 是一种社区研究工具。在编译语料库时,TLHdig 团队借鉴了由几代西台学者开发的数字和模拟资源,包括 Hethitologie-Portal Mainz 上的数字文本编辑项目以及许多个人的贡献。

作为一种协作工具,TLHdig 具有一个在线提交流程,供学者发布新的西台楔形文字文本。 用户可以将他们的音译复制并粘贴到创建者界面中,并按照提示完成提交。 如需进一步指导,用户可以在逐步手册中找到支持。

通过这种动态方法,TLHdig 将随着该领域的发展而不断扩展,确保它保持尽可能最新的状态,并且数据的数量和质量不断提高。 因此,它既是文本版本的基础,又是各种研究问题和方法(包括使用创新 AI 方法)的宝贵资源。

Provided by Julius-Maximilians-Universität Würzburg