NVIDIA 獲得美國能源部一千兩百多萬美元的 Exascale 研究合約

作者 Bill Dally

本人要在此宣佈ㄧ項振奮人心的好消息: NVIDIA 獲得美國能源部 (Department of Energy) 一份價值一千兩百四十萬美元的合約,並將依約進行研發工作,實現 Exascale 運算。我們已經迫不及待想跟能源部的科學家密切合作,共同促進科學進步。

根據這份為期兩年的合約,NVIDIA 必須針對處理器架構、電路、記憶體架構、高速訊號及編程模型展開研發工作,將 Exascale 電腦的功耗降低到能夠合理負擔的水平。整個研究的概念是運用上千個高效的吞吐量最佳化核心 (throughput-optimized cores) 執行主要工作,並運用少數延遲最佳化核心 (latency-optimized cores) 進行剩餘的序列運算。本公司將與能源部七座實驗室的科學家合作,確保我們的設計能夠滿足他們的需要與科學工作量。

這筆研究經費來自美國能源部的 Fast Forward 計畫。能源部推動這些計畫資助少數獲選的科技公司展開研發工作,最終目的就是達成超級運算的艱鉅任務 – 實現 Exascale 運算。能源部深深體會到,如果要處理會造成科學和技術運算負擔的工作,勢必需要一個高度平行、異質的運算架構。

Exascale 系統可以執行每秒 10 的 18 次方浮點運算 (也就是 10 億 X 10 億),速度比 petaflop (一千萬億次) 運算等級的超級電腦快一千倍。世界上目前最快的電腦可以達到約 16 petaflop 的運算等級。

開發 Exascale 系統時必須面臨ㄧ項巨大挑戰,那就是如何提升系統的用電效率。理論上來說,現在使用 x86 處理器就能建構出 Exascale 系統,但是運作過程需要多達 2GW (gigawatt,十億瓦) 的電力,相當於胡佛水壩的所有輸出電量。假如 Exascale 系統中的 GPU 是用 NVIDIA Kepler K20 處理器建立,這個 GPU 則會消耗大約 150MW (megawatt,百萬瓦) 的電力。美國能源部的目標就是在十年內開發出能減少 20MW 功耗的 Exascale 系統。

要在許多方面創造非凡突破,才有可能達成這種水平的用電效率,而我們堅信異構運算正是達成此目標的最佳方法。

美國能源部的動機為何?

美國為確保國家安全和經濟競爭力,積極開發 Exascale 系統。只要擁有超級運算系統,許多產業就能加快探索和創新的過程,受益良多。要解決世上最困難的科學挑戰,舉凡治療疾病、研究氣候變遷和開發效率更好的引擎,都需要借助超級電腦的力量。

本公司從 2010 年開始為美國國防部高等研究計畫局 (Defense Advanced Research Projects Agency, DARPA) 執行「梯隊系統計畫 (Project Echelon)」,讓我們開發出有彈性、高效率的吞吐量處理器 (throughput processor),奠定了堅實基礎。這次的 Exascale 研究正好延續我們在梯隊系統計畫的成果。

NVIDIA 是高速運算用大規模平行運算加速器 (massively parallel accelerators for supercomputing) 的領航者,我當初也是為此而加入公司。在最新的全球前 500 最快超級電腦排行榜中,已有五十多個搭載 GPU 的系統上榜。由此可見,我們的研究目前已經頗有斬獲,而且會在未來幾年帶來影響深遠的科學突破。我非常期待看到這些突破。