NVIDIA 發布數十種新的、更新的加速運算函式庫, 包含 NVIDIA ReOpt、cuQuantum、cuNumeric、cuGraph、Modulus、Morpheus、Nemo、 Megatron、Riva、RAPIDS、DOCA 等

作者 NVIDIA

用於加速 PyData 生態系的加速量子運算、最後一哩路運送和超級運算的 65 個軟體開發工具包,為 150 多種產品帶來了性能提升。

NVIDIA 發布了 65 個全新及更新的軟體開發工具包,包括函式庫、代碼樣本和指南,為正在推動廣泛運算挑戰前沿的資料科學家、研究者、學生和開發者帶來更好的特性和功能。

NVIDIA 創辦人暨執行長黃仁勳在其 GTC 主題演講中發布了這些新增內容,其中包括用於加速量子運算、到最後一哩路運送演算法和圖形神經網路挖掘的新一代 SDK。

NVIDIA 產品目錄中有 150 多個加速運算工具包,NVIDIA 開發者計劃中的近 300 萬名成員使用這些工具包,這個數字在過去五年增長了 6 倍。 CUDA 平行運算平台和編程模型僅在去年就被下載了 700 萬次,自發布以來的下載次數已達到 3000 萬次。

拓展新市場

新發布的 SDK 有:

  • NVIDIA ReOpt:用於即時物流,引進了先進的大規模平行演算法,可以優化車輛路線、倉儲選擇和車隊組合。其動態改道功能可以減少旅行時間、節省燃料成本並最大限度地減少閒置時間,這將為物流和供應鏈行業節省數十億美元。
  • cuNumeric:用於陣列計算,實現 NumPy 應用程式介面,可以自動擴展到多 GPU 和多節點系統,而不需要修改代碼。這對使用Python的 2000 萬名資料科學家、研究者和科學家意義重大。該工具包現已在 GitHub 和 Conda 上提供,可以擴展到數千個 GPU,為 PyData 和 NumPy 生態系統創造加速運算。
  • cuQuantum:用於量子運算,大大加快了模擬大型量子電路的速度,使量子研究者能夠研究更廣泛的演算法和應用空間。開發者可以模擬分子的近期變異量子演算法和能夠識別容錯的糾錯演算法等領域,也可以加速谷歌和 IBM 的流行量子模擬器
  • CUDA-X 加速 DGL容器:用於圖形神經網路,為從事大型圖形的 GNN 開發者和資料科學家提供了一種快速建立工作環境的方法。該容器使得在結合 DGL 和 Pytorch 的整合 GPU 加速 GNN 環境中的工作變得很容易。憑藉 GPU 加速 GNN,我們可以挖掘圖形中的洞察,即使是有接近一萬億條邊線的全球最大圖形也不例外。例如 Pinterest 使用具有數十億個節點和邊緣的圖形神經網路來了解其具有超過 3000 億個 Pin 的生態系統。該網路基於 GPU 和各種經過優化的函式庫,可用於模型的訓練和推論。

Amazon Web Services 機器學習總監 Alex Smola 表示:“我們團隊十分高興能與 NVIDIA 合作,通過用於圖形建構的 RAPIDS cuDF、用於圖形採樣的 RAPIDS cuGraph 和 GNN 的自定義計算內核來加速 DGL。而開源的 DGL 也能通過亞馬遜 NeptuneML 以託管式服務的形式提供。”

更新的 SDK 加速應用開發

眾多最受歡迎的 NVIDIA SDK 都增強了功能並進行了升級,包括 Clara、DLSS、RTX、Nsight 和 Isaac 工具包。

其他更新的 SDK 包括:

  • RAPIDS 21.10:用於資料科學,提供時間序列資料處理這項新功能並對現有演算法進行多項加速。適用於 Apache Spark 3.0 的 RAPIDS 加速器允許企業在不更改代碼的情況下加速其在 NVIDIA GPU 上的分析操作。今年以來,NVIDIA 最受歡迎的 SDK 之一—RAPIDS的下載量增長了 400%。
  • Deepstream 6.0:用於智慧影像分析的 Deepstream 6.0 引入了新的圖形合成器介面,使具有最低編碼能力的使用者也能使用電腦視覺,還引進了可視化拖放介面,可實現簡單、直觀的 AI 產品開發流程。
  • Triton 2.15TensorRT 8.2cuDNN 8.4:用於深度神經網路,為大型語言模型提供新的優化,並且為梯度增強決策樹和隨機森林提供推論加速。
  • DOCA 1.2:用於資料中心網路,提供一個零信任的安全框架,該框架通過硬體和軟體認證、線路速率資料加密、分佈式防火牆和智慧遙測來擴展威脅保護。
  • Merlin 0.8:用於推薦系統,具有預測用戶下一步行動的新功能,只需很少的用戶資料,甚至無需用戶資料,並且支援大於 GPU 記憶體的模型。

適用於 SDK 的新訓練課程

根據IDC預測,全球全職開發者的短缺數量預計將從 2021 年的 140 萬增加到 2025 年的 400 萬。該分析公司認為,彌補這一短缺的長期解決方案就是提供教育和提供更多的基礎設施。

NVIDIA 深度學習機構 (DLI) 的兩門新課程支援並加速開發者對 SDK 的學習和使用,為該學院的40多門課程目錄增添新的內容。

  • 用於 DPU 的 DOCA 介紹”是一門自學課程。該課程向開發者、研究者和學生介紹 NVIDIA DOCA 的基本概念。 NVIDIA DOCA 是一個用於在 NVIDIA BlueField DPUs 上實現加速資料中運算的平台。
  • 將於本月晚些時候推出的“建構即時影像 AI 應用”課程將介紹如何使用 NVIDIA DeepStream 智慧影像分析工具和 NVIDIA TAO 工具套件將原始影像資料轉化為基於即時深度學習的洞察,從而實現用於建構高性能串流媒體管道的硬體加速組件。

配合新 SDK 的 NVIDIA 深度學習機構課程包括:

為企業 AI 打造的 SDK

NVIDIA AI Enterprise 軟體套件包括 Triton 和 RAPIDS 等 SDK,可在主流加速伺服器上運行,並由 NVIDIA 優化、認證和支持。 開發人員可以利用 NVIDIA LaunchPad 計劃在精心策劃的實驗室中體驗 NVIDIA AI Enterprise。

前往 NVIDIA 開發者專區了解更多資訊。

觀看 NVIDIA 執行長黃仁勳的 GTC 主題演講