发表评论

A+

所属分类：科技

摘要

为解决这一问题，研究团队提出了 Aeneas ——一个多模态模型，这是一种 AI 工具，在分析和预测铭文时，它不仅能评估铭文物体的视觉特征，还能分析文本本身。这一过程依赖于历史丰富的嵌入式数据，用以捕捉文本…” />

XM外汇认为：

人类历史始于书写。铭文是最早的书写形式之一，供应了关于古代文明思想、语言和历史的直接洞见。

通常情况下，

然而，现有的数字化方法局限于文字层面的匹配，难以胜任古代文献中所需的繁琐推理与语境理解任务。

如今，Google DeepMind、诺丁汉大学团队及其合作者在这一领域取得了重大突破。他们推出的一款名为 Aeneas 的多模态生成式神经网络，能够协助对公元前 7 世纪至公元 8 世纪的拉丁铭文进行预测、断代、定位与解读。

值得注意的是，

相关研究论文以“Contextualizing ancient texts with generative neural networks”为题，已发表在权威期刊 Nature 上。

令人惊讶的是，

研究团队表示，大多历史学者认为，Aeneas 能够无缝融入现有研究流程，成为推动历史研究范式革新的有力辅助系统。

XM外汇消息：

来自埃克塞特大学的 Charlotte Tupman 在评论资料中指出，这类系统具有巨大的潜力，其应用不局限于古代史研究，还能够扩展到更晚时期的铭文，乃至其他语言。

值得注意的是，

展开全文

Aeneas: 让AI穿越回罗马帝国

铭文是探索古代世界的核心的资料，每年约有 1500 条拉丁铭文被新发现，记录着从皇帝法令到奴隶墓志铭的多样信息，展现了这个横跨 2000 年与 500 万平方公里帝国的文化与语言生活。

然而，解读这些珍贵的铭文并非易事，研究者往往面临诸多挑战。随着时间的推移，铭文中的字母、词语乃至整段数据可能已经遗失，而这些缺失部分的长度与数据往往难以预测，使得还原工作更加繁琐艰难。

文本修复、地理归属与年代判断等任务，都依赖于专家学者将铭文置于更广阔的语言与历史背景中加以理解。这一过程既耗时又需要高度专业的知识，学者必须将目标铭文与数百条潜在的平行铭文进行对比。研究者通常会专注于特定的地域和年代，但这也限制了他们在大规模识别铭文与历史联系方面的能力。

然而，

为处理这一疑问，研究团队提出了 Aeneas ——一个多模态模型，这是一种 AI 系统，在分析和预测铭文时，它不仅能评估铭文物体的视觉特征，还能分析文本本身。

说出来你可能不信，

图｜通过 Aeneas 架构对文本转录进行处理。

Aeneas 集成了一个上下文关联机制，能够为历史学家供应具有历史依据的文本和上下文铭文平行例证列表，以适配研究工作。为了捕捉在物质维度上更广泛的信息，Aeneas 将图像和转录文本共同输入进行整合，是首个能够生成任意长度古代文本修复结果的模型。

Aeneas 的输入是铭文的图像及其文本转录。其高效的架构完全基于字符运作，避免了先前方法中实现的基于单词级别的表示。至于铭文的语境化过程，Aeneas 会从其训练语料库（LED）中检索出与输入文本最相关的铭文平行例证列表。这一过程依赖于历史丰富的嵌入式数据，用以捕捉文本中的历史与语言模式，从而使模型能够基于语义和语境进行比较。

换个角度来看，

Aeneas 在另一个方面超越了先前的工作，该系统可为未知长度（而非指定长度）的缺失文本供应修复建议。这一能力对于研究严重受损的铭文尤为核心。

XM外汇消息：

图 | 缺失拉丁文文本的预测。Aeneas 能够预测受损铭文中丢失的文本（红色文本）。该系统无需了解缺失部分的长度即可进行预测，例如图中这个军事文书的案例。

容易被误解的是，

研究团队构建了一个覆盖广泛的拉丁铭文学数据集来训练 Aeneas 模型，包括 EDR、EDH 和 EDCS_ETL。他们开发了一套繁琐的处理流程来标准化元数据，利用唯一的 Trismegistos 标识符，消除歧义并处理文本，使其成为机器可处理的格式。并尽可能从这些数据集中获取铭文的图像。

Aeneas实际研究中表现如何？

为测试 XM外汇开户 Aeneas 在实际历史研究中的应用效果，团队组织了一项大规模的人机协作实验“古代历史学家与 AI”。研究邀请了 23 名具备铭文学专业知识的参与者，涵盖从硕士生到教授的不同级别，他们在设定的时间限制内，参与了一项模拟现实研究流程的实验，与 Aeneas 展开互动。

很多人不知道，

历史学者在 90% 的案例中认为 Aeneas 所检索的平行文本是有价值的研究起点，使他们在关键任务中的信心提高了 44%。在人机协同下，文本修复与地理归属任务的表现优于单独由人类或人工智能完成的结果。在断代任务中，Aeneas 达到了与真实年代范围平均相差 13 年的精度。

不可忽视的是，

他们将 Aeneas 与之前的 AI 模型进行了全面比较，Aeneas 在所有评测指标上均超越 Ithaca 与传统方法，它能够处理 Ithaca 无法应对的“未知长度缺损”疑问。在地理归属任务中，Aeneas 充分发挥了多模态架构的优势，其表现优于仅运用文本的模型。在年代归属任务中，Aeneas 对测试铭文的预测结果表现出惊人的准确性：平均误差仅 13 年，中位误差为 0 年，与历史学家供应的真实范围一致。

Aeneas 向大家展示了人工智能在推进历史研究方面的变革潜力，未来有多个方向值得进一步探索。

其中一个关键方向是将 Aeneas 的能力整合到大规模对话模型中。从而实现更自然、交互性更强的研究流程，使历史学家能够向系统提问、深入探讨模型的回答，并获得更清晰的解释。

更重要的是，

如何应对历史数据中固有的不确定性，特别是在年代归属方面，仍是一个核心挑战。未来研究可着重开发更优方法，来表示和评估宽泛的年代范围，不仅是在模型架构上进行改进，也可通过更精细的评估指标，更准确地反映历史断代实践中的细微差别，而不只依赖于与估计时间范围的距离。

不妨想一想，

另一个有前景的方向是开展更多消融实验，以量化不同模块的具体贡献（例如视觉输入对不同任务的影响）；以及探索上下文平行关系如何随不同文本输入而变化，以及系统对输入格式变动（以及不同类型铭文）的敏感性。

说到底，

进一步提升模型的多模态能力，需依托更大规模、高度标准化、并符合 FAIR 原则的数据集。

同时，将研究范围扩展到拉丁铭文之外，也是值得探索的研究方向。这将有助于更深入地挖掘视觉模态在地理归属之外的潜力，并可能通过图像学或其他考古学线索，辅助年代判断。

最后，他们认为深化跨学科合作至关核心，希望未来的研究项目能够持续推进，将人文学科与自然科学进一步联结起来。