新的人工智能模型可帮助破译和放置古代拉丁文碑文


自然》(Nature)杂志介绍了一种新的人工智能系统,它可以估算拉丁文古籍的写作时间,确定其原产地,甚至重建缺失的部分。

一种名为 "埃涅阿斯"(Aeneas)的新型人工智能系统正在书法领域掀起一场革命:它可以估算 古代拉丁文本的写作时间,确定其 原产地,甚至重建缺失的部分。Aeneas 是由《 自然》杂志上的一个国际团队开发的,该团队中的学者因创建了能够修复、确定古希腊碑文的年代和位置的模型 “伊萨卡”(Ithaca)而闻名。

破译古代碑文是一项复杂的任务,因为许多碑文都不完整,词汇也随着时间的推移而不断变化,而且可比资料来源分散,往往很难找到。英国诺丁汉大学的古文字学家 Thea Sommerschield 与谷歌 DeepMind以及华威大学、牛津大学和雅典经济与商业大学(AUEB)的研究人员合作开展了这一项目,她指出,将一个片段与类似的文本进行比较非常耗时。此外,正如悉尼大学的安妮-罗格森(Anne Rogerson)所指出的那样,新发现的数量在不断增加,单个研究人员不可能对其有全面的了解。

Aenaes“大大加快了这项复杂而耗时的工作。DeepMind 表示:”Aenaes 可大大加快这项复杂而耗时的工作,它能在数以千计的拉丁文碑文中进行推理,在数秒内检索出文字和上下文的相似之处,让历史学家能够解释并进一步发展模型的结果。它是一个生成式人工智能系统,在庞大的书法档案中进行了训练。该模型是在世界 三大碑文数据库罗马碑文数据库(EDR)、海德堡碑文数据库(EDH)和克劳斯-斯拉比碑文数据库(EDCS-ELT))中的 176,000 多个拉丁文碑文上训练出来的。名为 "拉丁碑文数据集"的总数据还包括约 5%碑文的图像。

Aeneas 能够帮助 “历史学家解释文本并将其与上下文联系起来,赋予孤立的片段以意义,得出更完整的结论,并重建对古代历史的更好理解”,包括以下高级功能先进的功能,如在大量拉丁文碑文中寻找相似之处,恢复缺失长度未知的文本中的空白,在恢复受损文本和预测其写作时间和地点方面具有尖端性能,但最重要的是,Aeneas 是 “第一个使用多模态输入确定文本地理出处的模型。它同时分析文本和视觉信息,如碑文的图像”。

Aeneas 有效性的一个具体例子是它在研究《Res Gestae Divi Augusti》中的应用,关于该书的年代问题一直存在很多争论。通过将年代问题转化为基于语言和上下文数据的概率估计,Aenaes 模型为解决长期存在的历史争论提供了一种新的定量方法。

"Aeneas旨在融入历史学家现有的研究工作流程。通过将专家知识与机器学习相结合,它开启了一个协作过程,提供了可解释的建议,这些建议是历史研究的宝贵起点。

新的人工智能模型可帮助破译和放置古代拉丁文碑文
新的人工智能模型可帮助破译和放置古代拉丁文碑文



免责声明:本篇意大利语原文的中文翻译由自动工具生成。 我们承诺会对所有文章进行审核,但无法保证完全避免因软件造成的翻译误差。 您可以点击 ITA 按钮查看原文。如发现任何错误,请联系我们