以色列猶太大屠殺紀念館使用深度學習來整理館藏數位媒體資料,讓全球更多遊客得以使用。
全球最知名的以色列猶太大屠殺紀念館,致力於為那些死於德國納粹及共犯手中的六百萬名猶太人,在後代子孫心目中保留回憶。
不過在其提供文獻資料給全球學者使用的世界大屠殺紀念中心(World Holocaust Remembrance Center)裡,堆滿了記錄著受害者及倖存者生活的數位媒體資料,在未詳加整理的情況,想要找到難如登天。
成立於耶路撒冷的一個組織採用人工智慧技術,以便在海量般的資料中找出、整理和串連照片及其它歷史文獻,好讓人們更容易找出要使用的資料。數十年間不斷有人提供和發掘出的文獻資料,現在幾乎全面完成數位化工作,成為全球研究猶太大屠殺領域之學者的重要資料來源。
每年有一百萬名遊客,其中包括六位美國總統造訪過以色列猶太大屠殺紀念館,館方的典藏資料裡包括獨一無二又描寫強烈情感的證詞影片、短片、照片、個人書面記錄、納粹相關文件及錄音檔案。這裡除了緬懷遭受希特勒殺害的受難者,還向將個人死生置之度外,試圖拯救他們的非猶太裔人士致敬。
全球各地上週正式接受國際大屠殺紀念日。
館藏資料量是國會圖書館資料量的兩倍
以色列猶太大屠殺紀念館擁有八億件數位資產,加起來容量超過 4PB(是美國國會圖書館館藏資料量的兩倍),使得該機構在製作這些歷史文獻的索引檔案,以供研究人員使用方面,成為一項艱鉅的挑戰,更不用說讓年輕世代能接觸到這些資料。
以色列猶太大屠殺紀念館的團隊運用深度神經網路,讓影像辨識演算法對數位歷史文獻建立索引和分類。以色列猶太大屠殺紀念館的資訊長 Michael Lieber 表示,如此一來便有機會在大屠殺受害者身上找到新的關係和故事。
Lieber 樂觀地認為人工智慧將有助於更能找出適合的資源,以便在其社群網路媒體官方帳號上,講述大屠殺受害者和倖存者的故事。他說這有助於館方不斷接觸到年輕群眾。
他也希望研究人員可以藉由深度學習技術,展現無法用其它方式找出的全新歷史資訊。
「我們是全球最早決定將這些文化資產進行數位化的機構之一,這麼一來才能讓更多人認識到大屠殺的過往。」Lieber 說。
改善提供更佳搜尋家族史的方式
許多人前往以色列猶太大屠殺紀念館,以研究祖父母及曾祖父母的遭遇,以及將他們的家族史拼湊起來。問題在於未來數位化資料的數量將翻倍成長,讓使用者難以進行搜尋。
以色列猶太大屠殺紀念館的技術團隊想要利用高效能運算深度學習技術來改變這一點。
研究團隊打算利用 NVIDIA DGX-1 AI 系統的超級運算能力,在深度學習技術的協助下整理和擴大這些歷史資料。一台 DGX-1 系統便可提供相當於數百台安裝 CPU 伺服器的運算能力,而其人工智慧運算能力則是超過 petaFLOP。
NVIDIA 資深解決方案架構師 Yuval Mazor 表示,DGX-1 使得以色列猶太大屠殺紀念館躋身成為全球最具創新力的組織之一,利用人工智慧來解決其面對的挑戰。
「他們使用人工智慧的舉動,帶來了實質的好處,像是以色列猶太大屠殺紀念館可以使用影片分析技術,理解和預測館內的人流量及對個別展品的影響,還有從豐富的歷史典藏資料裡提取深刻的見解。這些都有助於以色列猶太大屠殺紀念館完成其主要任務,也就是盡量接觸和教育人們。」他說。
Lieber 說非監督式學習有望為經過訓練的神經網路產生數位典藏品的元標籤,讓深度學習可以串連各類資訊上的點。
「如果你在毛特豪森-古森集中營找到一張監獄卡,系統會知道這是一張囚犯卡,接著引導你前往相關資料欄位和文件,你就能找到和辨識文件類型,在無人為干預的情況下獲得額外資訊。」他說。
另一種作法是派大批人員對數億個數位媒體資產加上標籤,並且持續追蹤和更新資料庫。
以色列的 NVIDIA 研發人員將與以色列猶太大屠殺紀念館合作進行這件事。