揭開 DPU 的面紗:驅動資料中心網路運作的引擎

作者 NVIDIA Corporation

科技圈終於在本週首度揭開 NVIDIA BlueField 資料處理器的面紗。自去年 NVIDIA推出 DPU 這個產品類別以後,雲端服務、超級電腦及許多 OEM 業者與軟體合作夥伴已紛紛開始採用。

帶領以色列 BlueField 設計團隊的首席架構師 Idan Burstein,將在 Hot Chips 大會上介紹 DPU 的架構。Hot Chips 每年皆吸引眾多全球頂尖的微處理器設計師出席這場年度盛會。在這場演講中,將發表一款用於加速現代資料中心的晶片引擎,這款引擎中有著一組硬體加速器與通用 Arm 核心,可以加快網路、安全性功能及儲存工作的運作速度。

這些工作包含虛擬化資料中心的硬體,同時確保網路流量的安全和順暢,包括在硬體中加速運行資料中心基本任務中不斷增加的作業負載,像是:

  • 安全性方面的 IPsec、TLS、AES-GCM、RegEx 及Public Key Acceleration
  • 儲存方面的 NVMe-oF、RAID 及 GPUDirect Storagee
  • 網路方面的 RDMA、RoCE、SR-IOV、VXLAN、VirtIO 及 GPUDirect RDMA
  • 視訊串流及時間敏感性通訊的卸載

這些作業負載的成長速度已經超越摩爾定律,佔據三分之一的伺服器 CPU 運行週期。DPU 將這些專用硬體整合起來,以更高效的方式來運行這些工作,釋放出更多 CPU 核心來處理資料中心的應用。

DPU 在不犧牲裸機效能的情況下提供虛擬化和先進的安全功能,它們的應用範疇涵蓋雲端運算、媒體串流、儲存、邊緣處理和高效能運算等多個領域。

NVIDIA 執行長黃仁勳形容 DPU 為未來運算領域發展的三大支柱之一。CPU 用於通用運算、GPU 用於加速運算,而 DPU 則在資料中心內移動資料以進行處理。

隨插即用的完整堆疊

在 Hot Chips 大會中有許多會讓處理器架構師著迷不已的晶片細節,對使用者來說,好消息是他們不需要精通這些,只要把現有軟體安裝到熟悉的高階軟體介面,就能發揮 DPU 的優勢。

這些 API 被綁定在稱作 NVIDIA DOCA 的 DPU 軟體堆疊裡,堆疊裡有驅動程式、函式庫、工具、文件、應用程式範例及一個 runtime 環境,以在整個資料中心的數千個 DPU 上配置、部署和調控服務。

已經有數百個組織向我們申請 DOCA 的早期試用,其中包括全球許多產業中的頂尖企業。

DOCA DPU software stack
DOCA 的軟體平台有助於快速開發 DPU 上的網路、儲存和安全應用程式

將 DPU 用於資料中心及雲端環境

全球已有多個最大型的雲端環境及一台 TOP500 排行榜上的超級電腦,採用在 Hot Chips 大會介紹的架構,並與下一代防火牆進行整合。多個頂尖 OEM 推出的系統很快也會採用這個架構,和來自超過十家軟體合作夥伴的支援。

全球多個雲端服務供應商正使用或準備部署 BlueField DPU,以安全配置運算執行個體。

BlueField 助力超級電腦及防火牆

劍橋大學利用 DPU 的效率,於今年六月推出了英國最高速的學術研究超級電腦,它在全球最節能系統的 Green500 排行榜上位居第三。它是全球第一部雲端原生超級電腦,研究人員可以在不影響效能的情況下,以保有隱私和安全的方式共享虛擬資源。

所有資料中心可以透過 Palo Alto Networks 的 VM-Series 新世代防火牆,獲得 DPU 的安全性功能。BlueField-2 可以加快 VM-Series 新世代防火牆的運作速度,檢查過去無法檢查的網路流量。

DPU 很快就會現身在華碩 (ASUS)源訊 (Atos)戴爾科技 (Dell Technologies)、富士通 (Fujitsu)、技嘉 (GIGABYTE)、新華三 (New H3C Information Technologies)、浪潮 (Inspur Electronic Information)廣達 (Quanta)/ 雲達 (QCT)美超微 (Supermicro) 推出的系統中,其中有部分業者在五月的COMPUTEX 大會中宣布了相關計畫

十餘家軟體合作夥伴將支援 NVIDIA BlueField DPU,包括:

  • VMware 發表 Project Monterey,將 DPU 提供給超過 30 萬個組織,他們皆仰賴 VMware 為他們帶來的速度、彈性及安全性。
  • Red Hat 將推出用於 Red Hat Enterprise Linux 及 Red Hat OpenShift 的開發者套件,有 95% 的《財星》全球 500 強企業 (Fortune 500) 使用。
  • Canonical 的 Ubuntu Linux,這是公有雲中最受歡迎的作業系統。
  • Check Point Software Technologies 的解決方案,被全球超過十萬個組織用來預防網路攻擊。

其他合作夥伴有 Cloudflare、DDN、Excelero、F5、Fortinet、Guardicore、Juniper Networks、NetApp、Vast Data 及 WekaIO。廣泛的產品支援來自於龐大的發展機會。

NVIDIA 財務長 Collette Kress 在五月的財報會議上表示:「世界上的每一個網路晶片都將成為智慧網路晶片,而這就是所謂的 DPU,它是晶片上的資料中心。」他預測日後每台伺服器都會搭載一個 DPU。

以 DPU 驅動的網路近在眼前

Dell’Oro Group 的市場觀察員預測,智慧網路埠的出貨量將增加近一倍,從 2020 年的 440 萬上升到 2025 年的 740 萬。

NVIDIA 為了迎向這股成長動能,在 GTC 大會上宣佈了接下來兩代 DPU 的發展路線圖。明年開始送樣的 BlueField-3,將驅動高達每秒 400Gbit 的網路,並擁有 300 個 x86 核心的運算實力。BlueField-4 在加入 NVIDIA 人工智慧 (AI) 運算技術後將能大幅提升效能。

從市場動能及本週的 Hot Chips 大會演講中可以看出,正如 NVIDIA 在 AI 領域的作為一般,如今 NVIDIA 也正引領著加速網路的發展。