實行節能:採用 NVIDIA 技術的新一代系統開啟迎向未來之路

作者 Chintan Patel

隨著摩爾定律即將告終,為了因應運算效能提升的無盡需求,使用傳統的方法勢必會大幅增加成本和能耗。

同時,為了減緩氣候變遷的影響,資料中心必須更有效率;現在資料中心每年消耗的能源已經超過 200 兆瓦時,將近全球能源用量的 2%

今天發佈的新一份全球最節能超級電腦 Green500 清單,呈現出加速運算的能源效率;而清單上的前 30 大系統也早已採用這項技術。其對能源效率的影響相當驚人。

我們估計 TOP500 系統每年需要超過 5 兆瓦時的能源,或價值 7.5 億美元的能源才能運作。

但如果這些系統與 TOP500 清單上前 30 名最環保的系統一樣有效率,則數字可能驟減 80% 以上至僅僅 1.5 億美元,省下 4 兆瓦時的能源。

反過來說,若與今日 TOP500 系統有著相同的預算再加上前 30 大系統的效率,這些超級電腦可望締造比目前多上 5 倍的效能。

此外,最新 Green500 系統所強調的效率提升只是個開端。NVIDIA 正致力提升其CPU、GPU、軟體和系統產品組合的效能。

Hopper 首見於 Green500 清單

在最新的 Green500 清單中,前 30 大系統內已有 23 個系統採用 NVIDIA 技術

值得注意的是,紐約市的 Flatiron Institute 以 Lenovo 打造的氣冷式 ThinkSystem 超級電腦,榮登 Green500 清單最節能電腦之冠;該系統便是採用 NVIDIA Hopper H100 GPU。

Green500 指出,這款別名 Henri 的超級電腦每瓦可產生 650 億個雙精度浮點運算,會用於處理運算天文物理學、生物學、數學、神經科學和量子物理學等相關問題。

NVIDIA H100 Tensor 核心 GPU 採用 NVIDIA Hopper GPU 架構,與前一代 A100 GPU 相比,人工智慧效能提升高達 6 倍,高效能運算效能則提升高達 3 倍,可說是專為締造極致效率而生。其第二代多執行個體 GPU 技術可將 GPU 分割成較小的運算單元,大幅提升資料中心使用者可用的 GPU 用戶端數量。

今年 SC22 大會展場內也有許多採用 NVIDIA 最新技術的全新系統,廠商包括 華碩 (ASUS)、源訊 (Atos)、戴爾科技 (Dell Technologies)、技嘉 (GIGABYTE)、慧與科技 (Hewlett Packard Enterprise)、聯想 (Lenovo)、雲達科技 (QCT)與美超微 (Supermicro)。

TOP500 清單中,由 Cineca 非營利聯盟託管、採用近 14,000 個 NVIDIA A100 GPU 的最高速全新電腦 Leonardo 位居第四,同時在節能系統中位居第 13。

最新 TOP500 清單為迄今為止採用 NVIDIA 技術最多者。

總計而言,TOP500 清單中有 361 個系統採用 NVIDIA 技術,且在全新系統方面則有 90% 都是如此 (詳見圖表)。

新一代經過加速的資料中心

NVIDIA 也正在開發新的運算架構,為經過加速的資料中心提供更優異的能源效率和效能。

今年稍早宣佈的 Grace CPU 和 Grace Hopper 超級晶片,將為 NVIDIA 加速運算平台進一步提升能源效率。由於 Grace CPU 驚人的節能特性和低耗能 LPDDR5X 記憶體,Grace CPU 超級晶片最高每瓦可提供相當於傳統 CPU 兩倍的效能。

假設一個 1 兆瓦的高效能運算資料中心,其中 20% 能源分配給 CPU 分割區,80% 分配給使用 Grace 和 Grace Hopper 的加速區,與同樣經過分割且搭載 x86 的資料中心相比,相同的功率預算可多完成 1.8 倍的工作量。

DPU 可進一步推動效率提升

除了 Grace 和 Grace Hopper,隨著模擬使用量日益增加,加快對超級運算服務需求的同時,NVIDIA 網路技術也讓雲端原生超級運算如虎添翼。

採用 NVIDIA BlueField-3 DPU 的 NVIDIA Quantum-2 InfiniBand 平台能提供雲端運算供應商和超級運算中心所需的極致效能、廣泛存取功能和強大安全性。

我們於近期的白皮書中指出 DPU 可用來卸載並加速網路、安全性、儲存空間或其他基礎架構功能及控制層應用程式,進而將伺服器耗電量降低達 30%。

隨著伺服器負載增加,節省的電力也會隨之增加,在伺服器為期三年的生命週期內,輕鬆為搭載 10,000 部伺服器的大型資料中心節省 500 萬美元的電力成本,還能額外省下冷卻、電源供應、機架空間和伺服器資本等成本。

運用 DPU 加速運算實現網路、安全性和儲存作業,是提升資料中心能源效率的下一個重要步驟。

用更少的能源事半功倍

科學方法快速轉換,變為需要運用資料分析、人工智慧及物理模擬推動,讓提升電腦效率成為下一代科學突破的關鍵,連帶促進這類開創性技術的問世。

NVIDIA 為研究人員提供專為這項新方法最佳化的多領域高效能運算平台,能締造效能和效率,使科學家有管道做出重大發現,進而造福人群。

更多資源