NVIDIA 加速全球首台 TOP500 學術雲端原生超級電腦 助力劍橋大學的研究發展

作者 Gilad Shainer

劍橋大學 (Cambridge University) 的全新開放式雲端原生超級電腦擁有頂尖的效能,將協助研究人員進行前所未有的科學探索。

Cambridge Service for Data Driven Discovery (CSD3) 是英國國家研究雲 (UK National Research Cloud) 的項目,同時也是全球效能最強大的學術研究超級電腦之一。其獲得由英國科學與技術設施委員會 DiRAC (STFC DiRAC)、英國科學與技術設施委員會 IRIS (STFC IRIS)、英國工程暨物理研究委員會 (EPSRC)、英國醫學研究委員會 (MRC) 和英國原子能管理局 (UKAEA) 支持的英國研究創新局 (UKRI) 資助,並委託劍橋大學進行管理。

這裡同時也是英國最大的學術研究雲端基地,目前正以運算力達 4 petaflops 的全新 Dell-EMC 系統進行強化,該系統採用 NVIDIA A100 GPU、NVIDIA BlueField DPU 和 NVIDIA InfiniBand 網路,將為英國學術研究機構在廣泛的研究領域上提供安全、多租戶、裸機的高效能運算人工智慧 (AI) 和資料分析服務。CSD3 採用由 NVIDIA 支援的全新雲端原生超級電腦平台,以及名為 Scientific OpenStack 的革命性雲端高效能運算軟體堆疊,其為劍橋大學和 StackHPC 所共同開發,並由 DiRAC HPC Facility 及 Iris Facility 所資助。

預計 CSD3 系統在部署時效能即可達 4 petaflops ,並躋身 TOP500 全球超級電腦。該系統採用 NVIDIA GPU 和 x86 CPU,並提供超過 10 petaflops 的總體效能,並包含基於 Dell/Cambridge 資料加速器的英國最快固態儲存陣列。

CSD3 為研究人員提供開放、安全的使用路徑,以解決全球各領域中最具挑戰性的難題,例如天體物理學、核融合發電開發,以及關乎生命的臨床醫學應用等領域。它將運用融合模擬、AI 和資料分析的工作流程推進科學探索,使研究人員可以在不犧牲應用效能或工作效率的情況下,更方便且更安全地使用。

NVIDIA DPU 和 HDR InfiniBand 支援次世代系統

NVIDIA HDR 200G InfiniBand 連接的 BlueField-2 DPU 使 CSD3 能夠從主機上卸載基礎架構管理,例如安全策略和儲存框架,同時為作業負載提供加速和隔離,以最大化輸入及輸出效能。

劍橋大學研究運算服務部門總監 Paul Calleja 表示:「能夠簡單、安全地使用 CSD3 的強大運算力,對於推動英國科學界和產業界的次世代科學發展而言至關重要。憑藉 NVIDIA InfiniBand 的極致效能、BlueField DPU 提供的卸載、隔離與加速,以及我們的『Scientific OpenStack』,劍橋大學將能打造出一台世界級雲端原生超級電腦,以推動造福全人類的研究發展。」

NVIDIA HDR InfiniBand 的網路運算引擎進一步加速網路效能,在提供最佳裸機效能的同時,為多節點租戶隔離提供原生支持。CSD3 利用最新一代 Dell-EMC PowerEdge 產品系列的優勢,其中 Dell EMC PowerEdge C6520 和 PowerEdge XE8545 伺服器皆針對資料密集型和 AI 作業負載進行優化。

CSD3 預計將於今年稍晚投入使用。欲了解更多關於 CSD3,請參考此網站