NVIDIA Hopper GPU 架構使用全新 DPX 指令,將動態規畫的執行速度加快 40 倍

作者 NVIDIA

今日於 GTC 大會中亮相的  NVIDIA Hopper GPU 架構將採用全新 DPX 指令,將動態規畫(Dynamic Programming)的執行速度加快 40 倍。基因組學、量子運算、路線最佳化等領域使用動態規畫演算法來解決問題。

NVIDIA H100 GPU 中的 DPX 指令將協助開發人員編寫程式碼,以加快多個產業所使用之動態規畫演算法的執行速度,推動加速疾病診斷、量子模擬、圖形分析及路徑最佳化的工作流程。

何謂動態規畫?

動態規畫技術發展於1950年代,是一項用於解決複雜問題的熱門技術,當中有兩大關鍵技術:遞歸和記憶。

遞迴是將一個問題拆解成更簡單的子問題,以節省時間和計算精力。記憶則是將這些子問題的答案儲存起來,在解決主問題時會多次重複使用。記憶提高了效率,稍後在解決主問題時,無需重新計算子問題的答案。

與 NVIDIA Ampere 架構的 GPU 相比,NVIDIA H100 GPU 所採用的 DPX 指令將動態規畫演算法的執行速度加快七倍。在搭載四個 NVIDIA H100 GPU 的節點上,還能進一步加快速度。

使用場合遍及醫療、機器人、量子運算、資料科學等領域

許多最佳化、資料處理和組學演算法常使用動態規畫技術。大多數開發人員到目前為止,都是在 CPU 或 FPGA 上運行這類演算法,但使用 NVIDIA Hopper GPU 上的 DPX 指令,可以大幅提高執行速度。

組學

組學(Omics)涵蓋了一系列的生物學領域,包括基因組學(專注於 DNA)、蛋白質組學(專注於蛋白質)和轉錄組學(專注於 RNA)。這些領域提供資訊給疾病研究和藥物發現的關鍵工作,這些工作全都依賴演算法分析,而 DPX 指令可以加快分析速度。

比如 Smith-Waterman 與 Needleman-Wunsch 動態規畫演算法用於 DNA 序列比對、蛋白質分類和蛋白質折疊。兩者都使用一種評分方法,衡量不同樣本基因定序的比對吻合程度。

Smith-Waterman 演算法可以得到非常精準的結果,但與其他比對方法相比,卻更花費運算資源和時間。科學家們在搭載四個 NVIDIA H100 GPU 的節點上使用 DPX 指令,可以將這個過程加快35倍,達到即時處理的程度,其中使用跟 DNA 定序一樣的速度來進行鹼基識別和比對工作。

加快速度將有助於全球各地的醫院實現基因組分析的普及化,科學家便更能提供個人專屬的醫療服務給患者。

取得最佳路徑

對於在動態倉庫中移動的自動操作機器人,甚至是在電腦網路上將資料傳給多個接收者的人來說,必須找出最佳的移動路徑。

開發人員為了找出最佳路徑,使用 Floyd-Warshall 動態規畫演算法,在地圖或圖形中所有兩兩一組的目的地之間找出最短距離。與傳統純 CPU 的雙插槽伺服器相比,在搭載四個 NVIDIA H100 GPU 的伺服器上,將 Floyd-Warshall 演算法的運算速度加快了 40 倍。

再加上 NVIDIA cuOpt 人工智慧物流軟體,工廠、自動駕駛車所使用的即時應用程式,或是抽象圖中的地圖和路徑演算法,在規畫最佳路徑時,都能享受速度提升所帶來的優點。

量子模擬

可以使用 NVIDIA H100 GPU 的 DPX 指令,對其它數不盡的動態規畫演算法進行加速。其中一個前途無量的領域便是量子運算,量子模擬的張量最佳化演算法中,便有使用動態規畫技術。DPX 指令能協助開發人員加快辨識正確張量收縮順序的過程。

SQL 查詢最佳化

資料科學是另一個潛在的應用領域。使用 SQL 程式設計語言的資料科學家,經常得對一組表格執行若干個「join」(連接)操作。 動態規畫有助於找出這些連接的最佳順序,通常可以省下大筆的執行時間,加快 SQL 查詢的速度。

進一步瞭解 NVIDIA Hopper GPU 架構的相關資訊。免費報名參加 GTC 線上大會,本次大會將舉辦至 3 月 24 日。敬請觀看以下的 NVIDIA 創辦人暨執行長黃仁勳的主題演講精彩重播: