NVIDIA Eos 揭曉:一窺前 10 大超級電腦的運作

作為全球企業的藍圖,NVIDIA 的突破性 DGX AI 超級電腦旨在為 AI 創新的下一個邊界提供動力
作者 Charlie Boyle

NVIDIA 於週四發布了一段影片,首次公開展示其最新的資料中心規模超級電腦 Eos,讓我們一睹為先進人工智慧(AI)工廠提供動力的架構。

Eos 是一個超大型 NVIDIA DGX SuperPOD,NVIDIA 開發人員利用加速的運算基礎架構和全面最佳化的軟體來實現 AI 突破。

Eos 由 576 個 NVIDIA DGX H100 系統、NVIDIA Quantum-2 InfiniBand 網路和軟體構建而成,提供總共 18.4 exaflops 的 FP8 AI 效能。

Eos 在 2023 年 11 月的 Supercomputing 2023 大會(SC23)上亮相,以希臘女神 Eos 命名,據說她每天打開黎明的大門,這彰顯了NVIDIA對推進AI技術的承諾。

Eos 超級電腦推動創新

每個 DGX H100 系統均配備八個 NVIDIA H100 Tensor 核心GPU。Eos 共有 4,608 個 H100 GPU。

因此,Eos 可以處理最大的AI工作負載,以訓練大型語言模型、推薦系統、量子模擬等。

它展示了 NVIDIA 技術在大規模應用時的能力。

Eos 的到來恰逢其時。人們正在利用生成式 AI 改變世界,從藥物探索到聊天機器人,再到自主機器等等。

為了實現這些突破,他們需要的不僅僅是 AI 專業知識和開發技能。他們需要一個 AI 工廠,一個隨時可用的專用AI引擎,並有助於提升他們構建大規模AI模型的能力。

Eos 展現出色,在全球最快超級電腦 TOP500 排行榜中排名第 9,突破了AI技術和基礎設施的極限。

它包含了 NVIDIA 先進的加速運算和網路技術,以及諸如 NVIDIA Base CommandNVIDIA AI Enterprise 等先進的軟體產品。

Eos 的架構針對需要跨越大型加速運算節點叢集實現超低延遲和高吞吐量互連的 AI 工作負載進行了最佳化,使其成為尋求擴展 AI 功能企業的理想解決方案。

基於採用網路內運算(In-Network Computing)技術的 NVIDIA Quantum-2 InfiniBand,其網路架構支持高達 400Gb/s 的資料傳輸速度,有助於快速移動訓練複雜 AI 模型所需的大型資料集。

Eos 的核心是由 NVIDIA DGX H100 系統所驅動的突破性 DGX SuperPOD 架構。

該架構旨在為 AI 和運算領域提供緊密整合、能夠進行龐大規模運算的全端系統。

隨著世界各地的企業和開發人員尋求利用 AI 的力量,Eos 成為一種關鍵資源,有望加速實現能為每個組織提供動力的 AI 驅動應用進程。