只要捲起來:因為維蘇威火山爆發而埋沒之古莎草紙藉助人工智慧浮現文字

作者 Jamie Beckett

兩千年前維蘇威火山爆發時的火山灰掩埋了龐貝城,也埋沒了鄰近赫庫蘭尼姆(Herculaneum)小鎮上的卷軸圖書館。在250多年前發現這些卷軸後,學者們花盡心思想判讀上面的字跡卻不得其門而入。

唯一從上古世界殘存至今的赫庫蘭尼姆圖書館,它掩藏起來的歷史即將展現在世人的眼前。在肯塔基大學研究團隊的努力下,他們利用人工智慧、GPU 與稱為「虛擬展開」的電腦影像程式,以數位化的方式分離和攤開緊捲的紙張,讓研究人員能閱讀上面的文字。

在閱讀這些古卷軸上已投入超過13年光陰的肯塔基大學電腦科學系主任 W. Brent Seales 說,「這份工作就像是印第安納.瓊斯在做的事。」

因熔岩高溫而呈現焦黑狀的赫庫蘭尼姆卷軸,外觀看起來像是超大根的雪茄或燒過的木頭,Seales 說簡單來看「這些卷軸的情況糟透了。」


因熔岩高溫而緊縮的赫庫蘭尼姆卷軸,
損傷程度約是百倍。圖片提供:
肯塔基大學的 Brent Seales。

如何不展開卷軸

想要真正展開脆弱的莎草紙卷軸,就一定會造成嚴重損壞,20-30呎長又嚴重受損百倍的卷軸極為脆弱易碎,上面的褶痕永遠無法撫平,而每個卷軸一層又一層的莎草紙又緊黏在一起。

想要分離每一層,就像是分離牛角麵包又薄又易剥落的酥皮一樣。

過去展開卷軸的結果簡直就是一場災難。發現卷軸後不久,一名梵蒂岡的古物保存員發明了一具能順利展開卷軸的機器,此舉卻付出了高昂的代價,完全無法閱讀每個卷軸一側的內容。後來又使用水銀或玫瑰水等物質來破壞寫有文字的羊皮紙,有些人乾脆讓紙張黏在一起,便無法閱讀其間的珍貴內容。

直到1985年,科學家試著使用混合乙醇、甘油和溫水的液體來鬆開紙張,其中一個卷軸剝落成碎片,其它部分乾燥後破裂成為300餘張碎片。

他們看我捲起來:恩戈地古卷

Seales 跟他的團隊運用使用電腦斷層掃描技術(這種 X 光可以產生出精細的數位生物組織影像),可以說幾乎完整展開了卷軸。他們將 CT 掃描內容裁切成縱向畫面,顯現出卷軸的內部結構,接著該團隊的軟體以數位化的方式攤開和重組紙張,讓研究人員能閱讀裡面的內容。

九月時 Seales 使用這項「虛擬展開」技術,協助辨識在以色列恩戈地(Ein Gedi)一處猶太教堂找到的受損古卷,裡面是聖經《利未記》的前兩章內容(深入閱讀該團隊在《Science Advances》期刊內發表關於虛擬展開與恩戈地古卷的文章)。

閱讀卷軸:漆黑卷軸上的深色文字

不過在恩戈地發現的一根卷軸,只有五層的厚度,而赫庫蘭尼姆圖書館裡卻是有著數百卷捲緊的厚卷軸。


赫庫蘭尼姆卷軸的電腦斷層掃描影
像顯示它的內部結構。圖片提供:
肯塔基大學的 Brent Seales。

在以數位方式展開這些層層相連的卷軸前,研究團隊得有能力分離裡面的每一層,而他們需要有 GPU 加速運算的機器學習技術。

Seales 跟他的團隊雖然還在努力優化展開的方法,目標是教導電腦自動偵測每一層紙張,沿著那一層精準追蹤每個點,直到準確辨識一整個卷軸。Seales 說要是紙張黏在一起,文字就會糊掉。

就算辨識完每一層紙張,還有閱讀文字這個難關。古人使用植物染料,或是焦黑的木頭和油來製作墨水,要是還沒燒焦到脆化的程度,就還能辨識莎草紙上的文字。電腦斷層掃描影像無法區分出燒焦的莎草紙和墨水。

Seales 早期使用機器學習技術進行研究,現在則是嘗試深度學習技術來閱讀卷軸上的文字,以及更有效地分離卷軸每一層的紙張。

最大的發現是什麼?

Seales 說:「技術上的確有相當大的難題。我們現在的進度是 NVIDIA 這樣子的硬體開發公司協助我們解決(需要大量運算資源)的問題,我剛開始進行這項研究時還沒有這些呢。」

他們使用的硬體就是 GeForce GTX 1070 顯示卡,加上以 cuDNN 及 CUDA 平行運算平台進行設定的 TensorFlow 深度學習架構來測試深度學習。

研究團隊目前正對250個卷軸進行展開作業,多數人認為館內有1,800餘個卷軸。要是人工智慧能解開赫庫蘭尼姆卷軸不為人知的秘密,學者們便有希望還原失落的古希臘和古羅馬文學作品。

「如果我們能有最佳閱讀這些材料的方法,加上發掘出其它材料,那就可能是五百年來最大的發現了。」他說。