入圍戈登貝爾獎決賽的研究團隊,使用 NVIDIA 的技術來對抗新冠病毒及推動科學發展

作者 NVIDIA

兩項對十億級數量原子的模擬結果,兩項對新冠病毒(SARS-CoV-2)的感染途徑所提出的新見解,以及一個加速藥物發現的全新人工智慧模型。

四支研究團隊以上述的研究成果,入圍了被視為高效能運算領域諾貝爾獎的戈登貝爾獎決賽。研究團隊利用人工智慧、加速運算或二者兼具 NVIDIA 的技術推動科學發展。

入圍新冠病毒研究特別獎決賽的團隊,利用人工智慧將多個模擬資料串連起來,以更上一層樓的清晰度,展示了病毒如何在宿主體內複製。

這項由阿貢國家實驗室的計算生物學家 Arvind Ramanathan 帶領進行的研究,能夠提高用於探索蛋白質結構的傳統工具解析度,或許能為遏止病毒傳播提供新的思路。

這支團隊由來自英美兩國的十幾個組織組成,他們設計了一個能夠跨系統運作的工作流程,包括由慧與科技 (HPE) 製造、搭載 NVIDIA A100 的 Perlmutter 超級電腦,以及阿貢國家實驗室的 NVIDIA DGX A100 系統

在這篇論文中寫道:「整合生物學是否能進行多站點資料分析和模擬的能力,對利用難以轉移的大型實驗資料來說是非常寶貴的。」

該團隊在研究活動中發展出一項技術,利用 GPU 上熱門的 NAMD 程式加速推動分子動力學的研究。他們還利用 NVIDIA NVLink 來提高資料的傳輸速度,「遠遠超過目前傳統高效能運算網路互連技術或是…PCIe 傳輸技術所能達到的速度。」

用極為逼真的畫面模擬十億個原子

南佛羅里達大學的物理學教授 Ivan Oleynik 領軍的團隊,以首個高精度十億個原子模擬畫面,入圍了戈登貝爾獎標準獎項的決賽。它以23倍的速度打破了去年戈登貝爾獎得主所締造的紀錄

「發掘出從未見過的現象是一大樂事,這是我們非常自豪的一項重大成就。」Oleynik 說。

模擬極端溫度和壓力下的碳原子,或許能為新能源打開大門,也能讓我們瞭解遙遠星球的構成。這個驚人的模擬結果達到量子等級的精準度,忠實反映出原子之間的作用力。

「我們只有在強大的 GPU 超級電腦上,使用機器學習技術才能達到這般精確度 – 人工智慧將為科學研究方式帶來不一樣的面貌。」Oleynik 說。

該團隊發揮美國能源部 Summit 超級電腦4,608台 IBM Power AC922 伺服器,以及27,900個 NVIDIA GPU 的強大運算能力,Summit 超級電腦由 IBM 負責建造,是全球最強大的超級電腦之一。它證明了該團隊的程式碼,能夠以幾乎 100% 的效率擴大到模擬200億個以上的原子。

想要突破材料科學界限的研究人員,都能取得這個程式碼。

在致命的飛沫裡面

第二支入圍新冠病毒特別獎決賽的團隊,利用另一個十億個原子的模擬內容,展示了空氣飛沫裡的 Delta 病毒變體(如下圖)。它揭示了生物傳播新冠肺炎及其他疾病的力量,首次以原子級的程度對氣溶膠進行觀察。

去年的特別獎得主、加州大學聖地牙哥分校研究員 Rommie Amaro 帶領之研究團隊所發表的論文中,提到這項研究成果「對深層肺部的病毒結合,以及對其他空氣傳播病原體的研究,具有深遠的…影響」。

Gordon Bell finalist COVID droplet simulation
由 Amaro 帶領的團隊以超過十億個原子,模擬呼吸道飛沫中的新狀冠狀病毒 Delta 變種。

「我們展示了人工智慧如何在多個層面上搭配高效能運算,進而大幅改善有效性,以便用新的方法去理解和審視複雜的生物系統。」Amaro 說。

研究人員運用 Summit 超級電腦上的 NVIDIA GPU,以及 戴爾科技 (Dell) 為德州先進運算中心及甲骨文 (Oracle) 雲端商用系統打造的 Longhorn 子系統。

該團隊在結論中寫道¨「高效能運算與雲端資源能夠顯著縮短解決重大科學問題的時間,以及串連研究人員,進行複雜的合作互動。」

藥物發現的語言

入圍新冠病毒特別獎決賽的橡樹嶺國家實驗室(ORNL)團隊,將自然語言處理(NLP)技術用於解決篩選新藥化合物的問題。

他們使用內有 96 億個分子的資料集(這是迄今用於這項任務最龐大的資料集),在兩個小時內訓練出一個可以加速發現新藥的 BERT NLP 模型。過去的最佳成績是花了四天,用有 11 億個分子的資料集來訓練一個模型。

這項研究工作在 Summit 超級電腦上,用了超過2.4萬個 NVIDIA GPU,提供高達 603 petaflops 的運算能力。完成訓練的模型可以在單一 GPU 上運行,幫助研究人員找到能夠抑制新冠肺炎和其他疾病的化合物。

橡樹嶺國家實驗室的計算科學家 Jens Glaser 表示:「我們這裡有合作單位想把這個模型用於研究癌症訊息傳遞路徑。」

帶領該團隊的研究科學家 Andrew Blanchard 說:「我們只是粗淺地探討了訓練資料的大小 – 希望很快能使用有一兆個分子的資料集進行研究。」

仰賴全堆疊解決方案

該團隊使用 NVIDIA 的人工智慧和加速計算的軟體庫,在一名觀察員所說的極短時間內完成了工作。

「我們不用對 GPU 的 Tensor Core 完全最佳化調整研究工作內容,不需要專門的程式碼,直接用標準的堆疊就行了。」Glaser 說。

他總結了許多決賽選手的感受:「科學家有機會進行別具意義的研究,對人們的生活產生潛在影響,這樣就滿足了。」

歡迎在 11 月 15 日週一下午 3 點(太平洋標準時間)觀看我們在 SC21 大會直播的特別演講,或者稍後通過點播觀看。NVIDIA 的 Marc Hamilton 將簡單介紹我們的最新動態、創新和技術,隨後將與 NVIDIA 專家進行現場問答。