最綠色環保的一代:NVIDIA、Intel 及合作夥伴合作助力提高人工智慧運算效率

搭配第四代 Intel Xeon 可擴充處理器的 NVIDIA Hopper 加速系統,包括 DGX H100 及來自 NVIDIA 合作夥伴的六十多款系統,其執行效率較傳統資料中心伺服器高出 25 倍,大幅節省能源成本
作者 SHAR NARASIMHAN

在人類推動各項改寫時代的顛覆性創新項目中,人工智慧 (AI) 是當中的核心 – 以前所未有的速度開發新冠病毒 (COVID) 疫苗及診斷癌症,再到支援自動駕駛車和瞭解氣候變遷。

幾乎各行各業都能受惠於採用 AI,但隨著神經網路日漸變得複雜,AI 技術也需要極為龐大密集的資源。為避免因運行這類運算基礎設施,而對發電造成需索無度的情況,必須盡量提高底層基礎技術的運行效率。

在 NVIDIA GPU 和 NVIDIA AI 平台的支援下,加速運算的效率提高,使資料中心能夠持續推動取得更新一代的突破性成果。

現隨著 Intel 推出第四代 Xeon 可擴充處理器,NVIDIA 及其合作夥伴已開始為高能效 AI 打造新一代的加速運算系統。這些系統搭載 NVIDIA H100 Tensor Core GPU,能夠提供較上一代產品更出色的運行效能、更佳的擴充性及更高的執行效率,每瓦有更亮眼的運算表現及解決問題的能力。

NVIDIA DGX H100 系統及由 NVIDIA 全球合作夥伴推出的六十餘款搭載 H100 GPU 的伺服器產品,都將搭載 Intel 的新款 CPU。

提高企業 AI 的運行速度、效率和節省成本

這些即將推出並搭載 NVIDIA 及 Intel 產品的系統,將協助企業運行各項作業負載,其效率比僅搭載 CPU 的傳統資料中心伺服器平均高出 25 倍。如此優異的每瓦效能代表完成工作所需的電力更少,這有助於確保讓資料中心盡量高效運用電力來完成最重要的工作。

與前一代加速系統相比,新一代的 NVIDIA 加速伺服器將訓練速度和推論的能源使用效率提高 3.5 倍,這麼一來便能真正降低成本,AI 資料中心的總持有成本降低 3 倍以上。

新款第四代 Intel Xeon CPU 可移動更多資料,加速執行 NVIDIA 的 AI 技術

全新第四代 Intel Xeon CPU 的特色之一便是支援 PCIe Gen 5 規格,可以將 CPU 到 NVIDIA GPU 及網路的資料傳輸速率提高一倍。新增的 PCIe 通道讓每台伺服器內可以部署更高密度的 GPU 和高速網路。

更高速的記憶體頻寬也提高處理 AI 等資料密集型作業負載的表現,而每個連接高達每秒 400 GB (Gbps) 的網路速度,則是讓伺服器與儲存裝置之間能更快傳輸資料。

搭載 H100 PCIe GPU 的 NVIDIA DGX H100 系統及 NVIDIA 合作夥伴的伺服器產品,都有 NVIDIA AI Enterprise 的使用授權,NVIDIA AI Enterprise 是一款採用端對端技術且安全的雲端原生 AI 開發和部署軟體,為高效開發企業 AI 提供一個完整的卓越平台。

NVIDIA DGX H100 系統提高超大型 AI 設施的運行效率

NVIDIA DGX H100 是全球首款專用 AI 基礎設施第四代產品,在加速資料中心作業系統 NVIDIA Base Command 軟體的支援下,成為一個完全最佳化的平台。

每個 DGX H100 系統搭載八個 NVIDIA H100 GPU、十張 NVIDIA ConnectX-7 乙太網路介面卡及兩個第四代 Intel Xeon 可擴充處理器,可提供打造大型生成式 AI 模型、大型語言模型推薦系統等所需的效能。

這個架構加上 NVIDIA 網路技術,能夠大規模提升運算效率,在訓練 AI 及處理高效能運算(HPC) 作業負載方面,其效能較前一代產品高出 9 倍,比未加速的 X86 雙插槽伺服器高出 20 至 40 倍。要是過去在單純 X86 架構伺服器叢集上訓練一個語言模型要 40 天的時間,在搭載 Intel Xeon CPU 及 ConnectX-7 網路技術的 NVIDIA DGX H100 上訓練同一個語言模型,只要短短的一到兩天便可完成。

NVIDIA DGX H100 系統是適用於企業的一站式 NVIDIA DGX SuperPOD 的構成單元,其提供高達 1 exaflop 的 AI 運算效能,顯著提升大規模部署企業 AI 的效率。

NVIDIA 合作夥伴提升資料中心的運作效率

對於處理 AI 資料中心的作業負載,NVIDIA H100 GPU 讓企業能夠更高效地打造及部署應用程式。

華碩 (ASUS)、源訊科技 (Atos)、思科 (Cisco)、戴爾科技 (Dell Technologies)、富士通 (Fujitsu)、技嘉 (GIGABYTE)、慧與科技 (Hewlett Packard Enterprise)、聯想 (Lenovo)、雲達科技 (QCT) 及美超微 (Supermicro) 等 NVIDIA 的合作夥伴,即將推出搭載 H100 GPU 和第四代 Intel Xeon 可擴充 CPU 的多款系統組合,將為全球企業帶來新一代的執行效能和能源使用效率。

作為未來效率提升的領頭羊,Flatiron Institute 搭載 NVIDIA H100 GPU 的 Lenovo ThinkSystem 超級電腦,榮登 Green500 榜單最節能電腦之冠,而在榜單的前三十名超級電腦系統裡,有 23 套系統採用 NVIDIA 的技術。Flatiron 的超級電腦系統使用的是 Intel 的前一代 CPU 產品,預計目前即將上市的系統會帶來更高的效率。

此外,用 NVIDIA ConnectX-7 網路技術及 Intel 第四代 Xeon 可擴充處理器連接伺服器,將提高伺服器的運作效率、減少基礎設施的數量及耗電量。

NVIDIA ConnectX-7 乙太網路介面卡支援 PCIe Gen 5 及每秒 400 GB 的 InfiniBand 和乙太網路連線,將伺服器之間及至儲存裝置的網路輸送量增加一倍。這些乙太網路介面卡支援先進的網路、儲存裝置和安全卸載。ConnectX-7 網路技術減少了所需的電線和交換機連接埠的數量,為大型 GPU 加速的高效能運算和 AI 叢集的網路省下 17% 以上的電力,有助於提高這些新伺服器的能源使用效率。

NVIDIA AI Enterprise 軟體提供完整堆疊的 AI 解決方案

這些下一代系統還為 NVIDIA AI Enterprise 軟體套件進行最佳化調整,大幅提升運作效率。

在 NVIDIA H100 上運行的 NVIDIA AI Enterprise 加快推動資料科學工作流,亦讓開發和部署預測性 AI 模型的作業變得更簡單,自動執行基本流程又快速從資料裡獲得洞察。

有著完整堆疊軟體庫的 NVIDIA AI Enterprise,其中包括參考應用程式、框架、預先訓練好的模型及基礎設施最佳化的 AI 工作流程,是順利擴大企業 AI的一個理想基礎。

歡迎免費註冊 NVIDIA LaunchPad,體驗在 NVIDIA H100 上執行由 NVIDIA AI Enterprise 支援的 AI 工作流程和框架。

敬請觀看 NVIDIA 創辦人暨執行長黃仁勳在第四代 Intel Xeon 可擴充處理上市發表會的精彩演講內容。