天氣變化:人工智慧、加速運算帶來更快速、更有效的預測

這些技術提供了加速和改進天氣預測和氣候建模並同時提高能效的極需能力
作者 HARRY PETTY

慕尼黑再保險公司估計,到 2050 年,極端天氣和氣候事件持續增加的頻率和嚴重程度可能導致每年百萬人死亡和 1.7 兆美元的損失。

特別是隨著暴風雪、颶風和熱浪等嚴重天氣事件的增加,突顯了對準確天氣預報的迫切需求,人工智慧和加速運算將能提供幫助。

超過 180 個天氣模擬中心採用強大的高效能運算(HPC)基礎架構來處理傳統數值天氣預測(Numerical Weather Prediction,NWP)模型。其中包括歐洲中期天氣預報中心(European Centre for Medium-Range Weather Forecasts,ECMWF),其透過 983,040 個 CPU 核心運行,以及英國氣象局的超級電腦,其使用超過 150 萬個 CPU 核心,耗電量為 2.7 兆瓦。

重新思考高效能運算系統的設計

全球對能源效率的推動促使人們重新思考高效能運算系統的設計。 利用 GPU 強大功能的超級運算,提供了一種有前景且節能的替代方案,可以加快運算速度。

Chart shows advantages for weather predictions of accelerated computing
左圖為基於 ECMWF 整合預報系統在Intel Broadwell CPU 上的 51 個系集成員,以及在 4 個 NVIDIA A100 Tensor Core GPU 上的 FourCastNet 1,000 系集成員的結果; 假設 10 個建模中心運行相同的預報工作量。 右圖為基於 ICON 模型測量效能的結果; CPU:2 個 AMD Milan。 GPU:4 個 NVIDIA H100 Tensor Core PCIe。

NVIDIA 的 GPU 對全球正在使用的天氣模型產生了重大影響,包括歐洲中期天氣預報中心、馬克斯普朗克氣象學研究所(Max Planck Institute for Meteorology)、德國氣象局(German Meteorological Service)和美國國家大氣研究中心(National Center for Atmospheric Research)的天氣模型。

GPU 將效能提升至 24 倍、改善能源效率,並降低成本與空間需求。

瑞士國家氣象和氣候辦公室(MeteoSwiss)的數值預測單位主管 Oliver Fuhrer 表示:「為了在電力預算限制內實現可靠的天氣預測和氣候預測,我們依賴演算法的改進和硬體,在這方面,NVIDIA 的 GPU 是 CPU 的替代方案。」

人工智慧模型提升速度和效率

與傳統方法相比,NVIDIA 基於人工智慧的天氣預測模型 FourCastNet 提供具有競爭力的準確性,且速度更快、能效更高。FourCastNet 能夠迅速生成為期一週的預報,並生成大型整合模型(或起始條件略有變化的模型),以實現高信度的極端天氣預測。

舉例來說,基於歷史數據,FourCastNet 準確預測了 2018 年 7 月 5 日在阿爾及利亞瓦爾格拉 (Ouargla, Algeria) 的溫度,那是非洲有記錄以來最熱的一天。

An example of efficiency, accuracy of AI-powered predictions
視覺化圖表(中間)展示了 2018 年 7 月非洲地區的真實天氣情況,周圍是展示由 FourCastNet(系集成員)生成的準確預測熱穹現象(Heat Dome)的地球模型。

使用 NVIDIA 的 GPU,FourCastNet 快速而準確地生成了 1,000 個系集成員,此超越了傳統模型的能力。十多個成員根據事發前三週的資料,準確預測了阿爾及利亞的高溫。

這是 FourCastNet 團隊首次提前幾週預測了高影響天氣事件,證明了人工智慧的潛力,可以用比傳統天氣模型更低的能耗進行可靠的天氣預報。

FourCastNet 採用了像是 Transformer 模型這樣最新的人工智慧進展,將人工智慧和物理學結合,獲得開創性的成果。其速度比傳統的數值天氣預測模型快大約 4.5 萬倍。且經過訓練後,FourCastNet 生成預測所需的能源比歐洲的黃金標準 NWP 模型——整合預報系統少1.2萬倍。

馬克斯.普朗克氣象研究所所長 Bjorn Stevens 表示:「NVIDIA FourCastNet 為將 AI 用於各種應用打開了大門,這將改變數值天氣預測企業的形態。」

拓展更多可能性

Stevens 在 NVIDIA GTC 大會一個演講中描述了 ICON 氣候研究工具現在的可能性。 Stevens 表示,Levante 超級電腦使用 3,200 個 CPU,可以在 24 小時內模擬 10 天的天氣。 相比之下,JUWELS Booster 超級電腦使用 1,200 個 NVIDIA A100 Tensor Core GPU,可以在相同的時間內運行 50 天的模擬。

Stevens 補充說,科學家正在研究未來 300 年內的氣候效應,這意味著系統需要快上 20 倍。他說,採用如 NVIDIA H100 Tensor Core GPU 以及更簡單的代碼等更快的技術,我們就能實現這個目標。

研究人員現在面臨的挑戰是在物理建模和機器學習之間取得最佳平衡,以生成更快、更準確的氣候預測。歐洲中期天氣預報中心上月發佈的一個部落格描述了這種混合方法,該方法依賴於機器學習進行初始預測,並利用物理模型進行資料生成、驗證和系統優化。

這種透過加速運算實現的整合,有機會在天氣預報和氣候科學方面取得重大進步,從而開啟一個高效、可靠和節能預測的新時代。

進一步瞭解加速運算和人工智慧如何促進氣候科學: