GTC 2020 主題演講 | NVIDIA CEO 介紹基於 NVIDIA Ampere 架構的 NVIDIA A100 GPU

作者 Brian Caulfield

NVIDIA 發布重磅最新軟體應用、硬體系統以及與 BMW 的合作。

NVIDIA 提出了下一代運算的願景,該願景將全球資訊經濟的重心從伺服器轉移到了新型的強大且靈活的資料中心。

NVIDIA 創辦人兼執行長黃仁勳在其加州住宅的廚房中錄製的主題演講中,介紹了 NVIDIA 最近對 Mellanox 的收購,還有引頸期盼的基於 NVIDIA Ampere GPU 架構的新產品以及重要的最新軟體技術。

這場主題演講原計劃於 3 月底在聖荷西舉行的 NVIDIA GPU 技術大會上發表,但因冠狀病毒疫情而受到影響。

黃仁勳在開場時說到,“我要感謝所有對抗 COVID-19 的前線勇敢戰士們。NVIDIA 正在與研究人員和科學家合作,使用 GPU 和 AI 運算來治療、緩解、控制和追踪這種大規模傳染性疾病。”

  • 牛津 Nanopore 科技僅用了七個小時就對病毒基因組進行了定序。
  • Plotly 正在進行即時感染率追踪。
  • 橡樹嶺國家實驗室和斯克里普斯研究所 (Scripps) 每天篩選出十億種潛在藥物組合。
  • Structura 生物技術公司,德克薩斯大學奧斯汀分校和美國國家衛生研究院已經重建了 COVID-19 棘狀蛋白的 3D 結構。


Structura 生物技術公司,德克薩斯大學奧斯汀分校和美國國家衛生研究院已經重建了 COVID-19 棘狀蛋白的 3D 結構。

NVIDIA 也宣布了其 NVIDIA Clara 醫療平台的更新,旨在對抗 COVID-19 新型冠狀病毒。

“研究人員和科學家們正在使用 NVIDIA 加速運算來挽救生命—這完美地詮釋了我們公司的宗旨:通過製造超級電腦,解決普通超級電腦不能解決的問題。”黃仁勳說。

演講主軸圍繞作為現代全球資訊經濟機房的資料中心如何變化,以及在上月完成交易的 Mellanox 收購案,雙方如何共同推動這些變化的願景。

“資料中心是新的運算單元,NVIDIA 正在加速從晶片到 CPU 和 GPU 的連接方式,再到整個軟體堆疊,以及最終跨整個資料中心的效能提升。”

資料中心規模運算的系統優化

首先,NVIDIA 為這種新型的資料中心規模運算優化了新的 GPU 架構,集 AI 訓練和推論於一身,並實現了靈活且彈性的加速。

NVIDIA A100 是第一個基於 NVIDIA Ampere 架構的 GPU,提供了在 NVIDIA 八代 GPU 裡最大的效能提升,它還可用於數據分析,科學運算和雲端繪圖,並已全面投產並交付給全球客戶。

全球 18 家領先的服務提供商和系統製造商正在將 NVIDIA A100 整合到他們的服務和產品中,其中包括阿里雲、AWS、百度智能雲、思科、戴爾科技、Google Cloud、惠與科技公司 (HPE)、微軟 Azure 和甲骨文。

相比上一代,NVIDIA Ampere 架構的 A100 將效能提升了 20 倍。A100 的五大關鍵特性包括:

  • 超過 540 億個電晶體,是全球最大的七奈米處理器。
  • 具備 TF32 的第三代 Tensor Cores,這是一種新的數值格式,可加速開箱即用的單精度 AI 訓練。NVIDIA 廣泛使用的 Tensor Core 現在更加靈活,快速,且更易於使用
  • 結構化稀疏 (Structural sparsity) 加速,這是一種新的高效技術,可以利用 AI 數學固有的稀疏性來獲得更高的效能
  • 多執行個體 GPU (Multi-instance GPU) 或 MIG,讓一個 A100 可以分割為多達七個獨立的 GPU,每個 GPU 都有自己的資源
  • 第三代 NVIDIA NVLink,使 GPU 之間的高速聯接能力加倍,從而可以使多個 A100 伺服器充當一個巨型 GPU

以上這些特性促成了 A100 效能的提升:與NVIDIA上一代的Volta架構相比,訓練效能提高了6倍,推論效能提高了7倍。

NVIDIA DGX A100 具備 5 Petaflops 的效能

NVIDIA 還將發售基於 NVIDIA A100 的第三代 NVIDIA DGX AI 系統 — NVIDIA DGX A100,世界上第一台 5 petaflops 伺服器。每台 DGX A100 可以分割為多達 56 個獨立運行的執行個體。


美國能源部阿貢國家實驗室,將使用 DGX A100 助力的 AI 和運算力更好地了解並對抗 COVID-19

這使得單個伺服器可以“縱向擴展”以完成諸如AI訓練之類的運算密集型任務,或者“橫向擴展”以進行AI部署或推論。

該系統的最初使用者是美國能源部的阿貢國家實驗室,該實驗室將利用該叢集的 AI 和運算能力更好地理解和對抗 COVID-19。此外,還有佛羅里達大學和德國人工智慧研究中心。

A100 也將作為 HGX A100 提供給雲端服務合作夥伴和伺服器製造商。

一套由五台 DGX A100 系統提供動力的資料中心,其成本僅為 100 萬美元,功耗僅為 28 千瓦,但其效能足以媲美一套典型資料中心,由 50 台用於 AI 訓練的 DGX- 1 系統和 600 個總功耗高達 630 千瓦的 CPU 系統構成,成本超過 1100 萬美元。

“買愈多,省更多。”黃在他的多次 GTC 主題演講中說道。

NVIDIA 還宣布了下一代 DGX SuperPOD。它由 140 台 DGX A100 系統和 Mellanox 網路技術建構而成,可提供 700 petaflops 的 AI 效能,堪比全球 20 台最快的超級電腦中的任一台。


新一代 DGX SuperPOD 實現了強達每秒 700 petaflops 的 AI 算力

NVIDIA 正在用四個 DGX SuperPOD 來擴展自己的資料中心,為其內部超級電腦 SATURNV,增加了 2.8 exaflops 的 AI 運算能力(總計 4.6 exaflops),使其成為世界上最快的 AI 超級電腦。

NVIDIA 同時也發布了 NVIDIA EGX A100,將強大的即時雲端運算功能帶到了邊緣。其 NVIDIA Ampere 架構 GPU 提供了第三代 Tensor Core 和新的安全功能。得益於其 NVIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯網功能。

當今世界上最重要的應用軟體

NVIDIA GPU 將為主要軟體應用程式提供動力,以加速三個關鍵用途:管理大數據,創建推薦系統和建構即時會話式 AI。

隨著機器學習的有效性推動公司收集了越來越多的數據,這些新工具應運而生。積極的反饋使我們體驗到的數據收集量呈指數級增長。

為了幫助各類組織順應潮流,NVIDIA 宣佈在 Spark 3.0 上支持 NVIDIA GPU 加速,大數據分析將成為當今世界上最重要的應用程式之一。

基於 RAPIDS 的 Spark 3.0,打破了提取,轉換和加載數據的效能基準。它已經幫助 Adobe Intelligent Services 將運算成本降低了 90%。

關鍵的雲端分析平台(包括 Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI 和 Google Cloud Dataproc)都將藉助 NVIDIA 加速。

“我們現在為未來做好準備,未來的數據量將繼續以數十或數百 PB 的速度呈指數級增長,達到 EB 級。”黃仁勳在他的主題演講中說道。

黃仁勳還宣布推出了 NVIDIA Merlin,這是一個用於建構下一代推薦系統的端到端框架,該系統正迅速成為更加個性化互聯網的引擎。Merlin 將創建一個 100 TB 數據集推薦系統所需的時間從四天減少到 20 分鐘。

他還詳細介紹了 NVIDIA Riva,這是一個新的端到端平台,可以充分發揮 NVIDIA AI 平台的強大功能,創建即時多模態對話式 AI

他通過一個演示來展示了與名為 Misty 的 AI 進行互動的過程,Misty 可即時理解並回答一系列有關天氣的複雜問題。

自 2018 年在 SIGGRAPH 上發布 NVIDIA RTX 以來,NVIDIA 在即時光線追踪方面取得了疾迅發展,當時宣布的 NVIDIA Omniverse 可以讓位於不同地方使用不同工具的設計師,在同個設計的不同部分同時工作。現在已經可供搶先體驗客戶使用。

自動駕駛汽車

自動駕駛汽車是我們這個時代最大的運算挑戰之一,NVIDIA 將持續通過 NVIDIA DRIVE 推動整個行業發展。

NVIDIA DRIVE 將使用內建 NVIDIA Ampere GPU 的全新 Orin SoC,以達到能效和效能,入門級 ADAS 系統開發所需功率僅需 5 瓦,並為 L5 級別 robotaxi 系統提供 2,000 TOPS 的效能。

現在,汽車製造商僅需單一運算架構和軟體堆疊,利用一種架構來將 AI 推進到整個車隊,並利用整個車隊來進行軟體開發。

NVIDIA DRIVE 生態系統現已覆蓋汽車、卡車、一級汽車供應商、下一代出行服務、新創公司、圖資服務和模擬。

黃仁勳並宣布 NVIDIA 將在 NVIDIA DRIVE 技術套件中增加用於管理整個自動駕駛車隊的 NVIDIA DRIVE RC。

機器人技術

NVIDIA 還將繼續推進其 NVIDIA Isaac 軟體定義的機器人平台,宣布 BMW 集團已選擇 NVIDIA Isaac 機器人技術為其下一代工廠提供動力。

每 56 秒鐘,BMW 集團在全球的 30 家工廠就會生產一輛汽車:40 種不同型號的汽車,每種都有數百種不同的選擇,3000 萬個零件來自全球近 2,000 家供應商。

BMW 集團加入了一個龐大的 NVIDIA 機器人技術全球生態系統,該生態系統涵蓋配送、零售、自主移動機器人、農業、服務業、物流、製造和醫療保健。

未來,工廠實際上將成為巨大的機器人。 “裡面的所有運動部件都會由 AI 驅動。”黃仁勳說。 “將來,每個批量生產的產品都將被逐一量身定制。”