大家認同:加速運算是節能的運算。
國家能源研究科學運算中心(NERSC)是美國能源部開放科學的主要機構,測量了其四個主要高效能運算和 AI 應用程式的結果。
他們測試了在 Perlmutter(使用 NVIDIA GPU 的全球最大超級電腦之一)上僅使用 CPU 和使用 GPU 加速節點時,應用程式運行速度以及能耗的情況。
結果很明顯。使用 NVIDIA A100 Tensor Core GPU 加速,能源效率平均提高 5 倍。一個天氣預報應用程式性能提升了 9.8 倍。
GPU 節省百萬瓦特
在一台搭載四個 A100 GPU 的伺服器上,NERSC 實現了於雙插槽 x86 伺服器高達 12 倍的加速。
這意味著在相同性能水平下,GPU 加速系統每個月將比僅使用 CPU 的系統節省 588 兆瓦時的能源消耗。如果在一個四路 NVIDIA A100 雲端執行個體上運行相同工作負載一個月,相較於僅使用CPU的執行個體,研究人員可以節省超過 400 萬美元。
衡量實際應用
這些結果意義非常重大,因為它們基於現實應用的測量,而不是合成的基準。這些進展意味著,8000 多名科學家使用 Perlmutter 能夠應對更大的挑戰,為更多突破開啟大門。在 Perlmutter 上使用超過 7100 個 A100 繪圖處理器,有許多應用案例,科學家正在探索亞原子交互作用,以尋找新的綠色能源。
全面推進科學發展
NERSC 所測試的應用領域涵蓋了分子動力學、材料科學和天氣預測等多個領域。例如,MILC 模擬了在原子中使粒子保持在一起的基本力量。它被用於發展量子運算、研究暗物質和尋找宇宙的起源。BerkeleyGW則有助於模擬和預測材料和奈米結構的光學性質,這是開發更高效電池和電子設備的關鍵步驟。
EXAALT 使用 A100 GPU 取得了 8.5 倍的效能提升,該應用程式解決了分子動力學中的一個基本挑戰。它讓研究人員可以模擬原子運動的短片,而不是其他工具提供的快照序列。
測試的第四個應用程式是 DeepCAM,用於在氣候數據中檢測颶風和大氣河流。當使用 A100 GPU 進行加速時,它的能源效率提升了 9.8 倍。
加速運算節省更多能源
NERSC 的結果與早期針對加速運算潛在節能的計算相呼應。例如,在 NVIDIA 的另一個獨立分析中,GPU 在人工智慧推理方面的能源效率比 CPU 高 42 倍。
這意味著將全球僅使用 CPU 運行人工智慧的伺服器轉換為 GPU 加速系統,每年可節省高達 10 兆瓦時的能源。這相當於節省了 140 萬個家庭一年的能源消耗量。
加速企業發展
您不必是一位科學家,也能透過加速運算提升能源效率。
製藥公司正在使用 GPU 加速的模擬和人工智慧來加速藥物研發過程。像 BMW 集團這樣的汽車製造商正在使用它來為整個工廠建模。
NVIDIA 創辦人暨執行長黃仁勳所說的「工業高效能運算革命」受加速運算和人工智慧的推動,而這些企業正是處於此革命前沿且企業還持續增加中。