NVIDIA 擴大對 Arm 架構開發者的支持

作者 Greg Estes

Arm 是全球採用率最高的運算平台,有數十億個裝置皆是使用這個架構 – 從手機、自動駕駛車到邊緣系統,還有那台世界上速度最快的超級電腦,也就是日本開發出的 Fugaku(富岳)超級電腦。

約有 1300 萬名開發人員支撐著如此龐大的系統。NVIDIA 將提供自家一套不斷增加的高效能運算、資料中心應用程式、邊緣運算及 PC 等工具給這個蓬勃發展的群體。

這些工具有:

  • NVIDIA AI – 加快人工智慧訓練與推論速度的產業標準
  • NVIDIA RAPIDS – 一套在 GPU 上運行資料科學及分析的軟體函式庫
  • NVIDIA HPC SDK – 多款編譯器、函式庫和軟體工具,以大幅提高開發人員的生產力以及高效能運算(HPC)應用程式的效能和可攜性
  • NVIDIA RTX – 提供光線追蹤與人工智慧功能的圖形驅動程式

NVIDIA 的邊緣運算及自動操作機器 Jetson 系統單晶片(SoC)多年來皆是使用 Arm 架構核心,而 BlueField DPU 等多款近期發表的網路產品同樣使用 Arm 架構核心。

BlueField 資料處理單元(DPU)能夠針對雲端、嵌入式裝置及企業應用程式,加快網路和儲存裝置的運作速度,並且保障其安全。我們將持續為這些產品的獨立軟體業者,在所有市場中進一步發展商業生態體系。

將 NVIDIA 最先進的 SDK、GPU 和 DPU 整合起來,而 Arm 又是節能運算領域的領導者,代表 Arm 與 NVIDIA 合作夥伴在四大領域能夠協助客戶提高能力,又獲得更多發展機會。

NVIDIA extends support for Arm
NVIDIA 支援 Arm 拓展從超級電腦到個人電腦及嵌入式系統。

高效能運算的新視野

Arm 正在擴大其處理器技術,以滿足全球規模最大、能力最強大之雲端運算環境及 HPC 系統的需求。NVIDIA 的工程師們已經開始支援富士通 A64FX 處理器內的 Arm 可伸縮向量擴充指令集(Scalable Vector Extensions, SVE),這也是日本富岳超級電腦所採用的處理器。

SVE 是 Arm Neoverse 資料中心運算與網路平台的最新成員。這些擴充指令集已經在富岳超級電腦上執行協助推動科學發展的各項模擬作業,而富岳超級電腦現居全球最強大電腦 TOP500 排行榜的冠軍。

我們的工作將協助 Arm 的合作夥伴和客戶,為合併使用 Neoverse CPU 及 NVIDIA GPU 的多款強大HPC 系統產生出最佳化的軟體。這是2019年6月宣佈之一項 HPC 計畫的最新一項內容,該計畫旨於支持 NVIDIA 的 CUDA 軟體在 Arm 架構上加快執行運算及人工智慧等作業。

除了 NVIDIA HPC SDK,現在也全面支援 HPC 的網路骨幹 NVIDIA Mellanox InfiniBand 軟體,並且部署在 Arm 伺服器上。工程師們也擴大 NVIDIA Magnum IO 中對 Arm 架構的支援程度,該軟體可以最大化多節點系統的儲存及網路效能。

雲端遊戲創造出重大機會

NVIDIA 與 Arm 伺服器的系統單晶片及 OEM 合作夥伴,在雲端運算方面開展了一系列的合作。

舉例來說,NVIDIA 與 Ampere Computing 合作,將其 Mt. Jade 伺服器平台擴大到雲端遊戲領域。採用 Ampere Altra 處理器的 Mt. Jade 伺服器平台,搭載了兩顆80核心 Arm 架構系統單晶片、四顆 NVIDIA T4 GPU 和一顆 NVIDIA Mellanox BlueField-2 DPU,能夠提供快速安全的網路功能。它們可以同時提供服務給128個遊戲用戶,以串流方式提供熱門的 Android-in-Cloud 服務連線給中國日益增長的 5G 智慧型手機用戶。

Mt. Jade server from Ampere Computing
Ampere Computing 的 Mt. Jade 平台在 NVIDIA 幫忙下,率先搶進新興的雲端遊戲市場。

NVIDIA 的工程師們為此兩年來一直致力於將程式碼移植到 Arm 架構上,並且開發新的工具,用最佳化的方式調整雲端遊戲的編碼、渲染作業,還有以串流方式將資料流入/流出 Arm 伺服器跟使用者的方式。這些工具已廣泛提供給 Arm 伺服器的 OEM 廠商,像是技嘉、Inspur 及 Wiwynn。

NVIDIA 憑藉自己經營 GeForce NOW 服務的經驗,對於雲端遊戲市場的潛力瞭若指掌。(補充:我們的媒體串流媒體裝置 SHIELD TV 採用 Arm 架構的系統單晶片)

除了遊戲領域,雲端服務供應商也將 Arm 架構伺服器用於機器學習、儲存及其它應用項目上,通過 GPU 來加快其執行速度。這正是 NVIDIA 提供一系列 GPU 管理和監控工具給 Arm 架構伺服器使用的原因,其中包括使用 Kubernetes 在 Arm 架構伺服器運行 Docker 容器的 NVIDIA Container Toolkit

將企業人工智慧帶給各公司

企業網路的邊緣是運算領域的下一個重要發展領域。NVIDIA EGX Edge AI 平台將支援包括 Arm 在內的各大主流處理器架構。

NVIDIA 察覺到邊緣運算節能的需求,將 Arm 當成其在垂直市場中推出加速運算及人工智慧平台的核心。這些平台通常在 Jetson 這樣的嵌入式模組內,把 GPU 與 Arm 架構的多核心 CPU 搭配在一起,這樣的嵌入式模組就像Jetson。

我們將這些模組的客製化版本,與用於醫療業的 Clara、用於機器人產業的 Isaac及用於自動駕駛車的 DRIVE 等特定行業的開發者套件搭配起來。它們為 Arm 軟體合作夥伴及系統單晶片供應商提供了眾多機會,可以用這些機會來實現企業人工智慧的目標。

NVIDIA 在收購公告中表示打算通過 Arm 提供其智慧財產,這些合作夥伴及供應商只會有更多發展機會。

未來事物的形態

多家供應商的 Windows 及 Chromebook 系統個人電腦早就採用 Arm 架構處理器,更多的消費性電子裝置平台也將跟進。這激發出人們對未來個人電腦系統的想法。

NVIDIA 一直以來均提供自家的 GPU 產品給各種形狀和尺寸的 PC 使用,當中包括採用 Arm 架構處理的系統。根據 Steam 在八月份進行的一項調查結果指出,超過七成的遊戲 PC 使用 NVIDIA 的 GPU。

未來人工智慧加速的個人電腦系統將迎來機遇,這些系統有著豐富的圖形和連線功能,跟目前的 PC 一樣強大,且更加節能。目前在醫療市場使用的一項 NVIDIA 參考設計內容就是一個例子,說明 Arm 商業生態體系能夠利用哪些功能跨足個人電腦系統等市場。

打造平台的工具

Arm 處理器智慧財產組合這樣的先進技術開創出新的平台,這就是 NVIDIA 的工程師們創造大量工具來支持這些平台的原因。

CUDA toolkit for Arm 使用  NVIDIA 的 GPU 加速運算和人工智慧功能來擴大其架構規模。開發者使用 CUDA 便能取得各項人工智慧工具,像是用於深度學習推論的 TensorRT 及用於分析視訊內容的 DeepStream

CUDA 是 NVIDIA 軟體引擎的重要組成部分,它包括一整套 Nsight 視覺化開發者工具,提供分析器、除錯器等工具來支援採用 Arm 架構的系統單晶片和伺服器。你可以在我們的開發者網站中,找到各項工具、SDK 和平台的簡要說明。

NVIDIA 十多年來始終支持著 Arm 架構,更多合作才要開始。我們很高興能夠加入這個不斷擴大的群體,這個群體支持著從智慧卡到超級電腦,還有未來將陸續出現的各種產品。

我們對於可能的合作方式有著諸多想法,希望向 Arm 商業生態體系的 1300 萬開發者請益。

現在報名參加  GTC 大會,以收看數百場直播及隨選講座活動還不算太晚。即日起至 10 月 9 日,使用優惠碼  CMB4KN 報名,即可享受  20%  的優惠。