把科學打包起來:研究人員用容器來加速創新

作者 AKHIL DOCCA

明尼蘇達大學把 NVIDIA NGC 當成人工智慧、高效能運算的軟體庫。

明尼蘇達大學超級運算研究所( MSI )的研究人員找到一種方法,使用容器來控制高效能運算與人工智慧產生出的眾多微小卻重要的軟體元素。

MSI 為明尼蘇達州的高效能運算研究學術機構重鎮,使用 NVIDIA GPU 來加快四百餘項應用程式的運行速度,這些應用程式遍及從瞭解癌症基因組學,再到氣候變遷的影響性,而要支援整個明尼蘇達州進行這些研究項目的數千名研究人員絕非易事。

每個應用程式都有自己複雜的組成部分,一個應用程式所需的硬體配置、編譯器和函式庫,可能跟另一項應用程式的需求有所衝突。

系統管理員可能會被升級、安裝和監控各應用程式的需求而搞得顧此失彼,管理員與使用者在不斷尋找最新和最好的程式碼時又讓他們感到精疲力盡。

為了避免掉入這些陷阱及提升使用者的能力, MSI 用了一些容器把應用程式及其所需的函式庫、運行引擎和其它軟體元素捆綁在一起。

容器加快應用程式部署

MSI 的用戶使用容器,便能在無需管理員協助的情況下,在幾分鐘內部署好應用程式。

MSI 研究運算部門副主任 Benjamin Lynch 說:「容器這項工具能夠提高研究工作流程關鍵元素的可移植性和再現性,它們在快速變化的軟體生態體系中扮演著要角,就像是我們在 NVIDIA GPU 上的人工智慧/機器學習所看到的那般。」

容器提供了運行應用程式所需的一切,研究人員不用擔心在測試於 Ubuntu 中建立的應用程式,在運行 MSI 的 CentOS 叢集上運行時,會出現不相容的情況。

明尼蘇達大學的地理運算科學家 Bryan Runck 表示:「容器是把複雜的農業環境模型封裝到可重現且輕鬆進行平行運行的工作流程內的重要工具,讓其他研究人員可以複製這項工作流程。」

NGC:集合了GPU 優化的高效能運算與人工智慧軟體

MSI 的研究人員選擇 NGC 容器 registry ,當成其取得 GPU 優化之高效能運算與人工智慧容器的來源。 NGC 的目錄內有著從深度學習到視覺化的各種容器,這些容器皆經過測試和調校,以提供最卓越的效能表現。

軟體優化在相同硬體上提供更佳的效能表現。

這些容器經過測試以獲得最佳效能,也對跨 x86 和 ARM 等多種架構的相容性進行測試,系統管理員便能輕鬆支援不同用戶。

針對 AI , NGC 收集了多項經過預先訓練的人工智慧模型和開發套件,研究人員可以將轉移學習技術用在這些模型上,以建立個人專屬的版本和減少開發時間。

明尼蘇達大學以農業為研究重心的資料科學家 Christina Poudyal 說:「能夠在高效能運算平台上運行容器化的應用程式,讓我們可以輕鬆著手研究,而 GPU 把運算時間減少了十倍以上。」

聚集高效能運算與人工智慧的工作量

聚集高效能運算與人工智慧應用程式,是推動 MSI 採用容器的另一個因素。這兩項工作量都用到 MSI 的 GPU 加速系統的平行運算能力。

這種融合催生出跨學科的研究工作。

「應用科學家與電腦科學家密切合作,從根本上推動人工智慧方法使用新式資料來源的方式,以及納入部分我們已經掌握的物理過程。」該校運算研究中心主任 Jim Wilgenbusch 說。

這些多學科團隊與 NVIDIA 合作,優化其工作流程和演算法,靠著更新、測試和儲存在 NGC 上的容器,以跟上人工智慧軟體的快速變化。