研究人員利用 GPU 人工智慧技術,解開這面用以觀測宇宙之「哈哈鏡」的奧秘。
重力透鏡一直都是縈繞在天文學研究人員心頭的事物之一,讓那些致力於尋找與研究它的人百思不得其解。
然而科學家將深度學習與電腦視覺用於當前強大望遠鏡所產生的大量資料之際,便能逐步運用數十萬個重力透鏡來擴大我們對宇宙的理解程度。
當一個或一群星系擋住,而看不到「後面」的另一個星系時,便會出現重力透鏡;第一個星系的重力會使得第二個星系發出的光線形成彎曲狀,讓第一個星系變成放大鏡,可以仔細觀察第二個星系。
科學家先確認出重力透鏡(科學界證明這是一大難題),再分析望遠鏡產生出的資料,不僅能更深入觀察那些更遙遠的星系,還可以瞭解暗物質的性質。暗物質是似乎一種遍及我們的宇宙各處的未知物質形態。
「我們從重力透鏡學到很多科學知識,可以利用這些資料來研究暗物質的分佈情況,還有恆星及星系的形成。」史丹佛大學卡弗里粒子天文物理與宇宙學研究所的 NASA 哈伯望遠鏡博士後研究員 Yashar Hezaveh 說。
鑽研深度學習
科學家一直要到最近,才使用大量精密的電腦程式碼來分析影像,而這得在超級電腦叢集上進行極為龐大的運算作業與大量的人為干預。但是當 Hezaveh 及其研究團隊決定要使用電腦視覺與神經網路,情況就改觀了。
史丹佛大學博士後研究員,也是此一主題報告的共同作者 Laurence Perreault Levasseur 表示:「我們沒有想到它會變得多美好,或者是它到底能不能派上用場。」
也可以把重力透鏡想成哈哈鏡,難處在於消除鏡子扭曲的效果,還有找到鏡子前面物體的真實影像。過去是將觀察結果跟在不同變形透鏡中看到的同一物體大量模擬影像資料進行比較,以找出哪一個與資料更接近。
不過神經網路可以直接處理影像並找出答案,不用使用大量模擬資料進行比較。原則上,這可以加快計算速度,只是訓練一個能明白各種波動如何影響著物質表現的深度學習模型(更不用說我們看到的畫面),還是得用到龐大的運算能力。
Hezaveh 及其團隊採用 GPU 來分析資料,便掌握更深入瞭解宇宙所需的速度和準確性。研究團隊使用史丹佛大學的 Sherlock 高效能運算叢集(在 NVIDIA Tesla 與 TITAN X GPU 的組合上運行),便能將訓練模型的速度提高到較使用 CPU 的程度快上100倍。
對於重力透鏡的理解,可望為那些想要更深入認識宇宙的人提供不少素材。
Perreault Levasseur 說:「透過這項工具可以解答很多科學問題。」
徵求:重力透鏡
當然得先找到重力透鏡上的資料,才能加以分析,而這正是歐洲三所大學的科學家正在進行的補充研究活動。
格羅寧根大學、那不勒斯大學與波恩大學的研究團隊在 Kilo-Degree Survey(KiDS)計畫裡,使用深度學習方法來找出新的重力透鏡。Kilo-Degree Survey(KiDS)是一項旨於更深入認識宇宙暗物質與質量分佈的天文學調查活動。
在一篇與他人合著詳細介紹深度學習之報告的 Carlo Enrico Petrillo 表示,就算該調查只是僅觀察一小片(大約 4%)的天空,使用人工智慧搭配 KiDS 也能發現多達2,500個重力透鏡。
可是想要實現這個目標,有著一大難題:缺少深度學習應用程式通常要使用的重要訓練資料。Petrillo 說他的團隊模擬重力透鏡四周的弧線和環,並將它們搭配真實星系的影像,以克服這個問題。
「我們用這種方式來模擬調查影像裡重力透鏡的所有特徵,像是解析度、波長和噪點。」Petrillo 說。
也就是說研究團隊將這個視為二元分類的問題:符合模擬內容,且被弧和環包圍的星系被標示為透鏡,不符合模擬內容的即被標示為非透鏡。隨著神經網路從每個模擬中汲取知識,研究團隊可以縮小候選對象的範圍。研究團隊的報告指出他們一開始使用這項方法。便將761個可疑重力透鏡縮減到56個。
NVIDIA GPU 縮短了將一批影像與模擬內容進行比對的時間,有助於落實這個目標。使用 CPU 的話,每批要25秒的時間,GeForce GTX 1080 GPU 則是將速度加快了50倍 (在報告裡是使用前一代 GeForce GPU 的結果,Petrillo 最近升級使用了新版本的 GPU)。
「使用 CPU 的話,我就達不到這些成果了。」他說。
將誕生出海量資料
隨著望遠鏡與深度學習技術不斷進步與創新,將會產生出海量的重力透鏡資料,像是 Petrillo 說歐洲太空總署的歐幾里得(Euclid)太空望遠鏡預計會產生數十 PB 級的資料量,而位於智利的大型綜合巡天望遠鏡(LSST)每晚將產生 30TB 的資料量。
這代表得消化大量資料、發現許多重力透鏡,還有掌握新的空間邊界 – 只要科學家的腳步能夠跟上。
Petrillo 說:「擁有眾多重力透鏡,代表能精確描繪星系的形成和演化、深入認識暗物質的性質,還有時空連續體本身的結構。我們需要高效率又快速的演算法來分析這些資料,當然,天文學家會很常使用機器學習這項工具。」