全球速度最快的超級電腦又將自己的效能紀錄翻了三倍

作者 Ian Buck

橡樹嶺國家實驗室展現出 Summit 超級電腦的混合精度功能,這在人工智慧超級運算的新時代裡極為重要。

全球速度最快的超級電腦,運算速度又提高了近三倍。

測試單位使用全新人工智慧超級電腦基準 HPL-AI,對橡樹嶺國家實驗室的 Summit 超級電腦系統進行測試,創下了刷新紀錄的 445 petaflops,或是近乎一半的 exaflops 運算效能水準。而這套系統在全球速度最快的超級電腦 TOP500 排行榜上,先前正式官宣的運算效能數字是 148 petaflops。

High-Performance Linpack(HPL)基準測試一直以來都是衡量超級電腦運算效能的標準,也是一年兩次公布之 TOP500 排行榜的基礎。

高效能運算領域的傑出人士 Jack Dongarra,在約三十年前推出 Linpack 這項基準測試內容,通過了時間的考驗,對超級電腦領域奠定了共同的測量基準。這項基準測試使用雙精度數學來估算超級電腦運行模擬這類 HPC 應用項目的效能表現。

HPL 雖仍是用於測量 TOP500 系統運行 HPC 應用項目之效能的可靠基準,不過現代的超級電腦還要處理人工智慧應用項目,並非只有處理模擬作業。多數人工智慧模型使用混合精度數學。這是一項截然不同的技術,使得研究人員能夠提高運算作業效率,又能獲得現代超級電腦裡有待開發的潛在效能。

以 HPL 標準為基礎的全新基準測試方法「HPL-AI」,加入了廣泛用於訓練人工智慧模型的混合精度運算內容,以便測量代表超級運算全新時代的人工智慧技術。

我們在 Summit 超級電腦上執行 HPL-AI 進行測試,證實了大規模進行 HPL-AI 測量活動的可行性,可以測量混合精度運算性能,同時也補足了現有的 HPL 基準測試內容。

「在提高超級電腦運算效率方面,無論是對於採用疊代精煉技術的傳統模擬內容還是人工智慧應用,混合精度技術的重要性已不可同日而語。正如 HPL 可以對雙精度功能進行基準測試,這種以 HPL 為基礎的新方法可以大規模地對超級電腦的混合精度功能進行基準測試。」Dongarra 說。

Azzam Haidar、Dongarra 及其團隊在 SC 2018 大會發表的報告裡,簡單介紹了 HPL-AI 背後採用的方法。

Summit 超級電腦達到運算效能的新巔峰

NVIDIA 在對全球速度最快的 Summit 超級電腦進行 HPL-AI 運算測試活動時,Summit 超級電腦只花了短短的26分鐘,便解開問題裡超過一千萬個方程式;而 Summit 超級電腦若是使用原本的 HPL,要花上77分鐘才能解開有著同樣規模的測試問題,使用 HPL-AI 一舉將時間縮短了三倍。

橡樹嶺國家實驗室副主任 Jeff Nichols 說:「從運算效能達到 200 petaflops 的 Summit 系統運到實驗室並完成安裝後,其中包括在 NVIDIA Volta GPU 助力下達到的混合精度 Tensor Core 功能,我們的目標便不只是使用系統獨特的這一面來執行人工智慧項目,也會用它來處理一般的 HPC 工作量。在處理 HPL 工作量方面寫下 445 petaflops 混合精度的結果(相當於 148.6 petaflops DP 結果),說明這套系統在處理一般 HPC 及人工智慧工作量方面,可以將運算效能提高三倍,這使得我們在以前所未有的規模提出科學研究成果方面,擁有巨大的競爭優勢。」

Summit 系統搭載了超過2.7萬個 NVIDIA V100 GPU,每個 GPU 使用數百個支持混合精度運算的 Tensor Cores入圍2018年戈登貝爾獎決賽的六組隊伍裡,有五隊的研究項目便是在有著 GPU 加速的 Summit 系統上進行運算作業,其中包括模擬和人工智慧研究項目。

科學研究人員改為將混合精度超級運算技術用於模擬和人工智慧的研究案上

化學、核能、石油與天然氣等研究領域的科學家,使用有著 NVIDIA GPU 支持的運算資源,期望為人工智慧及模擬等方面交出開創性的研究成果。

  • 核融合:核融合有效地在一個瓶子裡複製出太陽。核融合反應雖能夠無限提供乾淨的能源,這個過程卻會產生出高於攝氏一千萬度的溫度。再加上這個核融合過程也十分容易受到干擾,且難以維持超過幾秒鐘。橡樹嶺國家實驗室的研究人員模擬核融合反應,物理學家便能研究電漿核融合的不穩定性,以求更深入瞭解反應爐內部發生的情況。Tensor Core GPU 的混合精度功能可將模擬速度提高3.5倍,以推動國際熱核融合實驗反應爐(ITER)等頂尖設施發展永續能源。
  • 找出新的分子:無論是為了工業用途或是治療疾病的新藥而開發新的化合物,科學家都得找出及合成具有理想化學特性的新分子。Dow Chemical Company 的研究人員使用 NVIDIA V100 GPU 進行訓練和推論,針對化學品製造與製藥業用途開發出一款神經網路,以協助找出新的分子。
  • 解讀地震斷層 石油與天然氣產業分析地震影像來偵測斷層線,這是描述儲集層特徵及判斷井位的重要步驟。這個過程從頭到尾一般要花上數天到數週,德州大學的研究人員使用 NVIDIA GPU 訓練出一個人工智慧模型,只要短短幾毫秒的時間便能預測出斷層。

基準測試商業生態系統的生力軍

這並非首次推薦採用新的超級電腦運算基準測試方法。早在2007年推出 Green500 排行榜前,整個業界沒有一致的效率測量標準。

多種基準測試方法提供了不同觀點,有助於更全面地明白超級電腦的功能。

當前沒有哪一款基準測量方法可以最大規模超級電腦系統的混合精度功能,就像是原本的 HPL 無法測量雙精度功能一樣。HPL-AI 可以滿足此一需求,展現出超級電腦系統如何處理大規模人工智慧這般的混合精度工作量。