撰文丨王聰
編輯丨王多魚
排版丨水成文
據估計,每年發現的拉丁銘文在 1500 份左右,這些銘文或能揭示羅馬帝國的文化和語言生活。然而,研究這些銘文頗具挑戰性,因為在時間長河中,這些銘文往往缺失字母、單詞甚至段落,而且,語言也會隨時間演變。研究人員將這些銘文與其他包含相似詞匯或短語的銘文進行比較來進行分析,但這種任務通常很耗時而且高度專業化。此外,新的銘文不斷被發現,導致信息量太大,任何人都不可能全部掌握。
2025 年 7 月 23 日,谷歌 DeepMind 的研究人員在國際頂尖學術期刊Nature上發表了 題為:Contextualizing ancient texts with generative neural networks 的研究論文。
該研究開發了一款生成式人工智能模型——Aeneas(埃涅阿斯),該模型能夠尋找羅馬時期的拉丁銘文與其他文本的關系,幫助歷史學家確定文本語境,甚至能夠預測拉丁銘文的缺失部分。
為了更輕松地修復、翻譯和分析這些發現的銘文,谷歌旗下人工智能公司DeepMind聯合諾丁漢大學等機構的多位歷史學家,開發了一種生成式人工智能模型——Aeneas(埃涅阿斯),該模型基于世界上三個最大的拉丁銘文數據庫中的銘文進行訓練。合并后的數據集包含 176861 條銘文的文本,其中 5% 還有圖像,時間跨度從公元前 7 世紀到公元 8 世紀。
該模型由三個神經網絡組成,每個網絡負責不同的任務:修復缺失的文本;預測文本的來源;以及評估其年代。除了給出評估答案之外,Aeneas 還會提供數據集中與原始銘文相關性排名的類似銘文列表,以支持其給出的答案。
歷史學家表示,Aeneas 模型提供的語境建議在 90% 的情況下是有用的,并將關鍵任務的置信度提高了 44%。在判斷銘文年代時,歷史學家們單獨判斷銘文的年代與正確答案的前后誤差在 31 年左右,而 Aeneas 模型的前后誤差在 13 年以內。在確定銘文地理來源以及修復銘文部分文本時,歷史學家與 Aeneas 模型合作的準確率高于歷史學家或 Aeneas 模型單獨工作。
隨后,研究團隊在著名文獻《神圣奧古斯都事跡錄》上進行了測試,這部文獻詳細記載了羅馬皇帝奧古斯都的一生。Aeneas 模型對銘文年代的預測與歷史學家的預測相似,而且該模型沒有被文本中提到的日期所誤導。它還識別出了拼寫變化以及其他歷史學家會用來預測年代和起源的特征。
Aeneas 模型還在分析帶有拉丁銘文的祭壇時也表現出色,它在列出的類似銘文中提到了來自同一地區的另一座祭壇,研究團隊稱這很值得注意,因為模型并未被告知這兩座祭壇在地理上存在關聯,也未被告知它們來自同一時期。
Aeneas 模型修復受損的銘文,該銘文來自撒丁島的一塊青銅軍事證書殘片,由羅馬帝國皇帝頒發給一艘戰艦上的水手,年代為 公元 113-114 年。
研究團隊表示,Aeneas 模型能夠用于分析人類難以處理的海量數據,它還能幫助歷史學家找到與他們正在研究的銘文相似的銘文,這些工作通常需要花費人工數周甚至數月時間。此外,Aeneas 模型給出的答案似乎比流行的 AI 工具更具邏輯性,因為 Aeneas 模型給出的答案是基于其證據庫的合理假設,而非胡亂瞎猜。
論文鏈接:
https://www.nature.com/articles/s41586-025-09292-5
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.