解碼古文字,AI助力古代歷史研究
“碎片集”項目正在將數以萬計的楔形文字數字化。圖為一份天文學文本。
2019年,研究人員利用英國鉆石光源同步加速器掃描赫庫蘭尼姆古卷殘片。圖片來源:英國《自然》雜志
2023年10月,費德里卡·尼科拉爾迪收到了一封電子郵件,郵件附帶的一張圖片徹底改變了她的研究。此圖顯示了從公元79年維蘇威火山浩劫中幸存的一卷莎草紙殘骸,它于18世紀在赫庫蘭尼姆古城的一處豪華別墅遺跡中被發現。這些歷經滄桑的莎草紙,曾是數百卷古籍之一,卻因歲月侵蝕而變得脆弱不堪,多數已無法展開。
尼科拉爾迪是意大利那不勒斯大學的一名莎草紙學者,她曾參與一項利用AI讀取難解文字的研究。而今,她見證了一項奇跡:圖片上,一片莎草紙帶上,希臘字母密布如織,于幽暗中煥發新生。
這一名為“維蘇威挑戰”的項目只是AI重塑古代歷史研究的“冰山一角”。
神經網絡重建古代文本
幾十年來,計算機一直被用于對數字化文本進行分類和分析,但目前最令人興奮的是神經網絡的使用。神經網絡由相互連接的節點組成的分層結構組成,尤其是具有多個內部層的“深層”神經網絡。
卷積神經網絡(CNN)模型能夠從這些圖像中精準捕捉網格狀數據結構。CNN模型在光學字符識別領域大放異彩的同時,也開辟了其他多元化的應用途徑。例如,中國研究團隊在探索甲骨文時,巧妙地運用這些模型來復原遭受嚴重侵蝕的文字圖案,深入分析甲骨文隨時間的演變軌跡,并將破碎的文物碎片重新拼湊起來,重現歷史原貌。
與此同時,循環神經網絡(RNN)作為一種專為處理線性序列數據設計的模型,開始展現出在搜索、翻譯以及填補已轉錄古代文本缺失內容方面的巨大潛力。RNN已被用于為古巴比倫時期數百份格式嚴謹的行政和法律文本提供缺失字符的智能化建議。
那么,神經網絡能否在歷史的殘片中找出人類專家難以發現的聯系?2017年,英國牛津大學的一項合作開啟了探索之旅,當時,兩名研究人員正面臨破解西西里希臘銘文的難題。
古典學者通常依賴對現存文本的理解來詮釋新材料,但難以全面掌握所有相關資料。牛津大學研究人員認為,這正是機器學習可發揮作用的領域。他們使用基于RNN的Pythia模型,并用數萬份希臘銘文來訓練它,最終成功預測了文本中缺失的單詞和字符。
2022年,他們又推出Ithaca模型,不僅能預測缺失內容,還能為未知文本提供日期和來源地建議。Ithaca利用了Transformer模型的突破,能捕捉更復雜的語言模式。當前風靡全球的聊天機器人,如OpenAI的ChatGPT就是基于Transformer模型。
翻譯復原浩瀚歷史檔案
韓國研究人員有一項棘手的任務:整理世界上規模最大的歷史檔案之一。該檔案詳細記錄了27位朝鮮王國國王自14世紀至20世紀初統治時期的日常,涵蓋數十萬篇文章。美國紐約大學機器翻譯專家金亨俊表示,這些文本數據量極為龐大。
將這些文本人工譯成現代韓文,預計需耗時數十年。金亨俊攜手韓國同行,利用Transformer網絡訓練自動翻譯系統。結果顯示,AI譯文在準確性和可讀性上遠超古韓文,有時甚至優于現代韓文。
對于僅存少量文本的古代語言,研究人員也會采用神經網絡進行破解。希臘帕特拉斯大學的卡特里娜·帕帕瓦西里歐及其團隊,利用RNN恢復了克里特島諾索斯邁錫尼泥板中缺失的線性文字B文本。測試顯示,模型預測準確性高,且常與人類專家建議相符。
面臨驗證與利用雙重挑戰
利用AI破解古文字依舊面臨諸多挑戰。AI技術使非專業人士也能接觸到大量古代文獻,如何確保研究成果準確無誤,成為了首要挑戰。神經網絡的強大雖令人矚目,但其偶爾產生的誤導性結果,即“幻覺現象”,也讓人對結果的可靠性產生擔憂。
英國《自然》雜志指出,為解決這一問題,人文科學專家與計算機科學家需攜手合作,共同研究并驗證AI的解讀結果。同時,提倡將所有相關數據(包括原始文本、掃描文件、訓練模型及算法)實行開源,以此提升研究的透明度與可驗證性。這一做法被稱為“數字來源鏈”,旨在構建一個從原始數據到最終結論的完整鏈條,便于任何人回溯并核實研究過程。
此外,隨著數字化文本數量的激增,如何有效利用這些龐大的數據資源,從中提煉出關于古代社會的重要信息,也是研究人員面臨的新課題。這要求研究者轉變視角,從單一的文本分析轉向對整體文化的深入理解,并嘗試將不同地域、不同時期的文本數據相互關聯,以獲得更為全面的認識。
關鍵詞:
責任編輯:孫知兵
免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!
- 解碼古文字,AI助力古代歷史研究2025-01-15
- 專家詳解中國空間站未來開展的重點科學與應2025-01-15
- 2024年我國跨境電商進出口同比增長10.8%2025-01-15
- 英偉達AI芯片故障引發微軟等客戶削減訂單2025-01-15
- 日本人工智能應用潛力仍存2025-01-15
- AI生成的“垃圾科學”正侵蝕谷歌學術平臺2025-01-15
- IP聯名并非萬能鑰匙2025-01-15
- 2024年我國批準新建國家標準物質1135項2025-01-15
- 合眾思壯以技術驅動,構建更加美好的時空信2025-01-15
- 公司破產,檔案存哪里?能續繳養老保險嗎?2025-01-15
- 公安部:涉校刑事案件連續12年下降2025-01-15
- 法治在線丨聚餐飲酒后出意外 同飲者一定要2025-01-15
- (鄉村行·看振興)從“墻滿為患”到清爽“2025-01-15
- “時間銀行”+環保行動:“95后”臺灣社區2025-01-15
- 攜手向未來 2025上海香港聯會年會在滬舉行2025-01-15
- 1月14日全社會跨區域人員流動量完成16626.42025-01-15
- 燕教授燕莢“靈蛇新春送福氣”活動火爆上線2025-01-15
- 中國教育部擬同意設置福建福耀科技大學等142025-01-15
- 《勇氣滿分——全國中小學生體測公開課》開2025-01-15
- 《東莞市兒童友好城市建設管理辦法》2月施2025-01-15
- 湖南東安發展綠色產業 護林員端穩“綠飯碗2025-01-15
- 湖南零陵做強“綠色GDP ” 林下經濟2025-01-15
- 大學生校園“搬牛”引熱議,給校園管理怎樣2025-01-15
- 江蘇鹽城開啟“春運暖程”:返鄉旅客感受“2025-01-15
- 5歲遭父母拋棄、20歲雙眼突出……福州這家2025-01-15
- 恒心向黨 緬懷偉人 恒昌公益走進湖南“百2025-01-15
- 家庭教育培訓市場魚龍混雜,家長何處尋“良2025-01-15
- 法官為不合格父母送上家庭教育指導三封信2025-01-15
- 春運首日 浙江水上出行需求旺盛2025-01-15
- 合肥派河港站鐵路物流基地春運貨物裝車忙2025-01-15
精彩推薦
- 護航年末流動性 降準蓄勢待發
- 千億資金翻涌 信托公司能否成為綠色金...
- 市值管理新規推動估值重塑 央國企或成主導
- 央行連續操作注入流動性 降準預期再升溫
- 小黃象攜手中國國家U18冰球隊,以熱愛書...
- 北京花卉交易中心豐富市民“花樣”生活
- 南漳柑橘“致富經”:高山盆地“金果”...
- 市場監管總局:推動平臺企業和平臺內商...
- 遇見非遺丨把沉睡的泥土鐫刻進生活
- “江南蔬菜之鄉”江西樂平3000余畝水芹...
- 襄陽牛肉面:“熱辣滾燙”顯“俠義”
- 【百萬莊小課堂】今天你emo了嗎?職場青...
- 中國試點開放信用監管數據 便利境外來...
- 深圳年度最大規模畢業生雙選會提供崗位3...
- 廣西桂林滿城桂花飄香