NVIDIA 推出 Blackwell 平台,迎來運算新時代

作者 NVIDIA Corporation
  • 全新的 Blackwell GPU、NVLink 和強韌性技術支持兆級參數的人工智慧模型
  • 全新的 Tensor 核心和 TensorRT-LLM 編譯器可將 LLM 推理營運成本和能源降低最多達 25 倍
  • 全新型加速器實現資料處理、工程模擬、電子設計自動化、電腦輔助藥物設計和量子運算的突破
  • 各大雲端服務供應商、伺服器製造商和領先的人工智慧公司廣泛採用

NVIDIA 今天宣布 NVIDIA Blackwell 平台已經到來,為運算新時代提供動力,使世界各地的組織能夠在兆級參數大型語言模型上構建和運行即時生成式人工智慧(AI),而成本和能耗比其前身最低可達25 倍。

Blackwell GPU 架構具有六項用於加速運算的變革性技術,這將有助於在資料處理、工程模擬、電子設計自動化、電腦輔助藥物設計、量子運算和生成式 AI 方面實現突破,這些對 NVIDIA 都是新興產業機會。

NVIDIA 創辦人暨執行長黃仁勳表示:「三十年來,我們一直在追求加速運算,目標是實現深度學習和 AI 等變革性突破。生成式 AI 是我們這個時代的決定性技術。 Blackwell 是推動這場新工業革命的引擎。,我們將與世界上最具活力的公司合作,實現人工智慧對每個產業的承諾。」

計劃採用 Blackwell 的眾多組織包括 Amazon Web Services、戴爾科技集團、Google、Meta、微軟、OpenAI、甲骨文、Tesla 和 xAI。

Alphabet Google 執行長 Sundar Pichai 表示:「將搜尋和 Gmail 等服務擴展到數十億用戶,教會了我們如何管理運算基礎設施。隨著我們進入AI平台轉型,為了自己的產品和服務,以及我們的雲端客戶,我們繼續深入投資基礎設施。我們很幸運能夠與 NVIDIA 建立長期合作夥伴關係,並期待將 Blackwell GPU 的突破性功能帶給我們整個 Google 的雲端客戶和團隊,包括 Google DeepMind,以加速未來的發現。」

亞馬遜總裁暨執行長 Andy Jassy 表示:「我們與 NVIDIA 的深度合作可以追溯到 13 年前,當時我們在 AWS 上推出了世界上第一個 GPU 雲端實例。今天,我們在雲端的任何地方提供最廣泛的 GPU 解決方案,支援世界上技術最先進的加速工作負載。這就是為什麼新的NVIDIA Blackwell GPU 將在 AWS 上運作得如此出色,也是 NVIDIA 選擇 AWS 共同開發 Project Ceiba 的原因,該專案將 NVIDIA 的下一代 Grace Blackwell 超級晶片與 AWS Nitro System 先進的虛擬化技術和超高速 Elastic Fabric Adapter 網路結合,用於 NVIDIA 自己的 AI 研發。 透過 AWS 和 NVIDIA 工程師的共同努力,我們將繼續共同創新,使 AWS 成為任何人在雲端中運行 NVIDIA GPU 的最佳場域。」

戴爾科技集團創辦人暨執行長 Michael Dell 表示:「生成式 AI 對於創造更智慧、更可靠和更有效率的系統至關重要。戴爾科技集團和 NVIDIA 正在共同努力塑造科技的未來。隨著 Blackwell 的推出,我們將繼續為客戶提供下一代加速產品和服務,為他們提供推動跨產業創新所需的工具。」

Google DeepMind 共同創辦人暨執行長 Demis Hassabis 表示:「AI 的變革性潛力令人難以置信,它將幫助我們解決世界上一些最重要的科學問題。Blackwell 突破性的技術能力將提供所需的關鍵運算,幫助世界上最聰明的人開闢全新的科學發現。」

Meta 創辦人暨執行長 Mark Zuckerberg 表示:「從我們的大型語言模型到內容推薦、廣告和安全系統,AI 已經為一切提供了動力,並且它在未來只會變得更加重要。我們期待使用 NVIDIA 的 Blackwell 幫助訓練我們的開源 Llama 模型並建立下一代的 Meta AI 和消費產品。」

微軟董事長暨執行長 Satya Nadella 表示:「我們致力於為客戶提供最先進的基礎設施,提供他們的 AI 工作負載動力。透過將 GB200 Grace Blackwell 處理器導入我們全球的資料中心,以我們在雲端最佳化 NVIDIA GPU 的悠久歷史為基礎,同時我們也為世界各地的組織兌現了 AI 的承諾。」

OpenAI 執行長 Sam Altman 表示:「Blackwell 實現了大幅的效能躍升,並將加快我們推出領先模型的能力。我們很高興繼續與 NVIDIA 合作來增強 AI 運算。」

Oracle 董事長暨技術長Larry Ellison 表示:「Oracle 與 NVIDIA 的密切合作將在 AI、機器學習和資料分析方面實現質和量的突破。為了讓客戶發現更多可行動的洞察,必須要有像 Blackwell 這樣專門為加速運算和生成式 AI 而構建的更強大的引擎。」

Tesla xAI 執行長 Elon Musk 表示:「目前沒有什麼比 NVIDIA 硬體更好的 AI 硬體了。」

此全新架構以 David Harold Blackwell 命名,紀念這位專門研究賽局理論和統計學的數學家,他也是第一位入選美國國家科學院的黑人學者。此架構繼承了兩年前推出的 NVIDIA Hopper™ 架構。

Blackwell 創新推動加速運算和生成式AI

Blackwell 的六項革命性技術共同支援 AI 訓練和即時大型語言模型推理,模型可擴展至 10 兆個參數。其中包括:

  • 世界上最強大的晶片:Blackwell 架構 GPU 配備了 2080 億個電晶體,採用台積公司客製化 4 奈米製程製造,兩倍光罩尺寸GPU裸晶透過 10 TB/s 的晶片到晶片互連連接成單個、統一GPU。
  • 第二代 Transformer 引擎:透過新的微張量擴展(micro-tensor scaling)支援以及 NVIDIA 的先進動態範圍管理演算法整合到 NVIDIA TensorRT™-LLM 和 NeMo Megatron 框架中,Blackwell 將利用新的 4 位浮點 AI 推論能力支援加倍地運算和模型尺寸。
  • 第五代NVLink:為了加速多兆參數和混合專家(mixture-of-experts) AI 模型的效能,最新版本的 NVIDIA NVLink® 提供了每個 GPU 驚人的 8TB/s 的雙向吞吐量,確保在最複雜的大型語言模型中高達 576 個 GPU 之間實現無縫的高速溝通。
  • RAS 引擎: Blackwell 驅動的 GPU 包含一個專用引擎,可實現可靠性、可用性和可服務性。 此外,Blackwell 架構還增加了晶片級功能,利用基於 AI 的預防性維護來運行診斷和預測可靠性問題。 這樣可以最大化系統正常運行時間,並增強大規模 AI 部署的彈性,使其連續數週甚至數月不間斷地運行,並降低運營成本。
  • 安全 AI:先進的機密運算功能可在不影響效能的情況下保護 AI 模型和客戶資料,並支援新的本機介面加密協定,這對於醫療保健和金融服務等隱私敏感產業至關重要。
  • 解壓縮引擎:專用解壓縮引擎支援最新格式,加速資料庫查詢,以提供資料分析和資料科學的最高效能。 未來幾年,公司每年花費數百億美元的資料處理將越來越使用 GPU 加速。

巨大的超級晶片

NVIDIA GB200 Grace Blackwell 超級晶片透過 900GB/s 超低功耗 NVLink 晶片到晶片互連技術將兩個 NVIDIA B200 Tensor Core GPU 與 NVIDIA Grace CPU 連接起來。

為了獲得最高的 AI 性能,GB200 驅動的系統可以與今天宣布的 NVIDIA Quantum-X800 InfiniBand 和 Spectrum™-X800 乙太網路平台連接,這些平台可提供速度高達 800Gb/s 的先進網路。

GB200 是 NVIDIA GB200 NVL72 的關鍵元件,NVIDIA GB200 NVL72 是一種多節點、液冷、機架規模系統,適用於運算最密集的工作負載。 它結合了 36 個 Grace Blackwell 超級晶片,其中包括透過第五代 NVLink 互連的 72 個 Blackwell GPU 和 36 個 Grace CPU。 此外,GB200 NVL72 還包括 NVIDIA BlueField®-3 資料處理單元,可在超大規模 AI 雲端中實現雲端網路加速、可組合儲存、零信任安全性和 GPU 運算彈性。 與 NVIDIA H100 Tensor Core GPU 相比,GB200 NVL72 可提供高達 30 倍的大型語言模型推論工作負載效能,並將成本和能源消耗降低多達 25 倍。

該平台充當單一 GPU,具有 1.4 exaflops 的 AI 效能和 30TB 的快速記憶體,是最新 DGX SuperPOD 的構建塊。

NVIDIA 提供 HGX B200,此伺服器主機板能透過 NVLink 連接八個 B200 GPU,以支援基於 x86 的生成式 AI 平台。HGX B200 透過 NVIDIA Quantum-2 InfiniBand 和 Spectrum-X 乙太網路平台支援高達 400Gb/s 的網路速度。

Blackwell 合作夥伴的全球網絡

合作夥伴將從今年稍晚開始提供基於 Blackwell 的產品。

AWSGoogle CloudMicrosoft AzureOracle Cloud Infrastructure 將成為首批提供Blackwell 驅動執行個體的雲端服務供應商。NVIDIA 雲端夥伴計劃的公司包括Applied Digital、CoreWeave、Crusoe、IBM Cloud 和 Lambda 也同樣將提供相應的產品。 主權 AI 雲端也將提供基於 Blackwell 的雲端服務和基礎設施,包括 Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle EU Sovereign Cloud、Oracle 美國、英國和澳洲政府雲端、Scaleway、Singtel、Northern Data Group 的 Taiga Cloud、 Yotta 資料服務的 Shakti Cloud 和楊忠禮電力國際。

GB200 也將在 NVIDIA DGX™ Cloud 上提供,這是一個與領先的雲端服務供應商共同設計的 AI 平台,讓企業開發人員能夠專門存取建置和部署先進生成式 AI 模型所需的基礎設施和軟體。 AWS、Google Cloud 和 Oracle Cloud Infrastructure 計畫在今年稍後託管基於 NVIDIA Grace Blackwell 的新執行個體。

思科、戴爾科技集團慧與科技聯想和美超微預計將提供基於Blackwell 產品的各種伺服器,還有Aivres、永擎電子華碩、Eviden、鴻海技嘉科技英業達和碩聯合科技雲達科技、緯創資通、緯穎科技和雲達國際科技。

此外,包括 Ansys、Cadence 和 Synopsys 等全球領先的工程模擬公司與持續增加的軟體製造商,將使用基於 Blackwell 的處理器來加速用於設計和模擬電氣、機械和製造系統及零件的軟體。他們的客戶可以利用生成式 AI 和加速計算,更快地、以更低的成本和更高的能源效率將產品推向市場。

NVIDIA 軟體支援

用於生產級 AI 的端對端作業系統 NVIDIA AI Enterprise 支援 Blackwell 產品組合。 NVIDIA AI Enterprise 包括今天發布的 NVIDIA NIM™ 推論微服務,以及企業可以部署在 NVIDIA 加速雲端、資料中心和工作站上的 AI 框架、函式庫和工具。

欲了解更多關於 NVIDIA Blackwell 平台的資訊,請觀看 GTC 主題演講註冊參加 GTC 上由 NVIDIA 和產業領導者舉辦的大會,此大會將持續到 3 月 21 日。

關於 NVIDIA (輝達)

NVIDIA(輝達)自 1993 年成立以來始終為加速運算領域的先驅。自 1999 年發明 GPU 起便成功促進 PC 電競市場的成長、重新定義電腦繪圖,並引領現代人工智慧時代。NVIDIA 為一間全方位的運算公司,提供資料中心規模的產品以重塑產業樣貌。欲瞭解更多資訊,請瀏覽 https://nvidianews.nvidia.com/

新聞聯絡人

NVIDIA
資深公關經理 王懷璐
電話:(02)6605-5700
E-mail: Kate Wang
霍夫曼公關
莊昇諺/王一中/高楷婷
行動電話: 02-7713-7609/02-7713-7109/02-7713-6798
E-mail: Anthony Chuang/Stephen Wang/Hazel Kao

本新聞稿根據目前預期所做出的前瞻性聲明,包含但不限於:NVIDIA的產品、合作、服務和技術(包括NVIDIA Blackwell 平台、 Blackwell GPU架構、強韌性技術、客製化 Tensor 核心技術、NVIDIA TensorRT-LLM、NeMo Megatron 架構、, NVLink、NVIDIA GB200 Grace Blackwell超級晶片、B200 Tensor 核心 GPU、NVIDIA Grace CPU、NVIDIA H100 Tensor 核心 GPU,、NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X800 以太網路平台、NVIDIA GB200 NVL72、NVIDIA BlueField-3 資料處理單元、DGX SuperPOD、HGX B200、Quantum-2 InfiniBand和Spectrum-X 乙太網路平台、BlueField-3 DPUs、NVIDIA DGX Cloud、NVIDIA AI Enterprise和NVIDIA NIM推論微服務)的優勢、影響、性能、特色和可獲得性,以及目標是實現深度學習和AI等變革性突破;Blackwell GPU 是推動這場新工業革命的引擎;我們將與世界上最具活力的公司合作,實現人工智慧對每個產業的承諾;使用或提我們產品;服務與基礎架構的第三方;工程模擬公司利用生成式AI和加速計算,更快地、以更低的成本和更高的能源效率將產品推向市場等。這些前瞻性聲明包含可能導致實質結果與預期不符之風險與不確定因素。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;NVIDIA的產品借重第三方協力廠商之製造、組合、封裝和測試;技術發展和市場競爭之影響;發展新產品與技術或強化現有的產品及技術;NVIDIA或合作廠商的產品的市場接受度;設計、製造或軟體缺陷;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的NVIDIA產品或效能降低之技術缺失,以及NVIDIA定期提交給美國證券交易委員會(SEC)報告中的其他詳細因素,包含但不限於Form10-K的年度報告和Form10-Q的季度報告。NVIDIA 在公司官方網站上免費提供定期提交給SEC的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態。除非法律規定,否則NVIDIA沒有意願或義務因為新資訊、未來事件或其他理由而更新或修改任何前瞻性聲明。

©本文為NVIDIA 公司 2024版權所有,並保留所有權利。NVIDIA和NVIDIA 標誌是NVIDIA 公司在美國及其他地區的商標及(或)註冊商標。所有其他公司及產品名稱乃為所屬個別公司之商標。功能、訂價、出貨時程和規格之變更不會另行通知。