- 頂尖電腦製造商、雲端服務供應商和 GPU 雲端供應商,可強化訓練與測試階段的推論擴展能力,範圍涵蓋推理以及代理型與實體AI
- 全新的開源 NVIDIA Dynamo Inference Software 可擴大推理AI服務,不僅傳輸量大幅提升、回應時間更快,而且總體擁有成本也降低
- 適用於AI基礎架構的 NVIDIA Spectrum-X Enhanced 800G Ethernet Networking,大幅降低延遲和抖動程度
【2025年3月18日,美國聖荷西訊】NVIDIA 今日發表新一代的 NVIDIA Blackwell 人工智慧(AI)工廠平台 NVIDIA Blackwell Ultra,為 AI 推理時代奠定基礎。
NVIDIA Blackwell Ultra 強化訓練與測試階段的推論擴展能力。這項技術在推論過程投入更多的運算資源,提高準確度,讓世界各地的組織都能加速應用 AI 推理、代理型 AI,以及實體 AI。
Blackwell Ultra 以一年前推出的劃時代 Blackwell 架構為建置基礎,包含 NVIDIA GB300 NVL72 機架規模解決方案與 NVIDIA HGX™ B300 NVL16 系統。GB300 NVL72 的 AI 效能比 NVIDIA GB200 NVL72 提升 1.5 倍,並且相比基於 NVIDIA Hopper™ 的 AI 工廠,將 Blackwell 在 AI 工廠市場的營收機會提升 50 倍。
NVIDIA 創辦人暨執行長黃仁勳表示:「AI發展突飛猛進,推理和代理型AI需要比當前高出數個量級的運算效能。Blackwell Ultra 就是為了這個時刻所設計。這個多功能的單一平台,可輕鬆高效執行預訓練、後期訓練與推理AI推論。」
NVIDIA Blackwell Ultra 是AI推理的推手
NVIDIA GB300 NVL72 採用機架規模設計,連接 72 顆 Blackwell Ultra GPU 與 36顆 Arm Neoverse 架構 NVIDIA Grace™ CPU,是專為測試階段擴展打造的單一大型 GPU。有了 NVIDIA GB300 NVL72,AI模型便可利用平台更強大的運算能力,探索問題的各種解決方案,並將複雜的請求分解為多個步驟,締造更高品質的回應內容。
NVIDIA DGX™ Cloud 預計也會提供 GB300 NVL72。這個位於主要雲端上的端對端全託管 AI 平台,利用軟體、服務和 AI 專業,因應不斷演變的工作負載將效能最佳化。採用 DGX GB300 系統的 NVIDIA DGX SuperPOD™ 使用 GB300 NVL72 機架設計,提供客戶一站式 AI 工廠。
相較於 Hopper 世代,NVIDIA HGX B300 NVL16 在大型語言模型上的推論速度提升11倍、運算能力提升 7 倍、記憶體容量增加 4 倍,可為AI推理這類最複雜的工作負載,提供劃時代的效能。
此外,Blackwell Ultra 平台非常適合以下應用,包括:
- 代理型AI,運用精密複雜的推理與迭代規劃,自主解決複雜的多步驟問題。AI代理系統不只是聽從指令行事,還可推理、規劃並採取行動,達成特定目標。
- 實體AI,讓公司能夠即時生成合成的逼真影片,用於大規模訓練機器人和自駕車等應用情境。
NVIDIA 橫向擴充基礎架構,實現最佳效能
先進的橫向擴充網路是AI基礎架構的關鍵元件,可提供最佳效能,並減少延遲和抖動程度。
Blackwell Ultra 系統無縫整合 NVIDIA Spectrum-X™ Ethernet 與 NVIDIA Quantum-X800 InfiniBand 平台,透過 NVIDIA ConnectX®-8 SuperNIC,為系統的每個 GPU 提供 800 Gb/s 的資料傳輸量。這項整合提供了頂尖的遠端直接記憶體存取能力,讓AI工廠和雲端資料中心能夠順利處理AI推理模型,避免瓶頸問題。
此外,Blackwell Ultra 還採用 NVIDIA BlueField®-3 DPU,可實現多租戶網路、GPU 運算彈性、加速資料存取,以及即時網路安全威脅偵測。
全球科技領導廠商採用 Blackwell Ultra
合作夥伴預計自 2025 年下半年起推出搭載 Blackwell Ultra 的產品。
除了 Aivres、華擎科技、華碩、鴻海科技集團、技嘉科技、英業達、和碩聯合科技、雲達科技、緯創與緯穎,思科、戴爾科技集團、慧與科技、聯想集團與美超微預計也將推出各樣搭載 Blackwell Ultra 產品的伺服器。
雲端服務供應商 Amazon Web Services、Google Cloud、Microsoft Azure 與 Oracle Cloud Infrastructure,以及 GPU 雲端供應商 CoreWeave、Crusoe、Lambda、Nebius、Nscale、Yotta 與 YTL,將率先提供 Blackwell Ultra 驅動的執行個體。
NVIDIA 軟體創新技術減少人工智慧瓶頸
全端的 NVIDIA 人工智慧平台支援整個 NVIDIA Blackwell 產品組合。同樣於今日發表的 NVIDIA Dynamo 開源推論架構,提供最高效的測試階段擴展運算解決方案,可擴大推理AI服務、大幅提升傳輸量,並且縮短回應時間及降低模型服務成本。
NVIDIA Dynamo 是全新的AI推論服務軟體,可為部署推理AI模型的AI工廠產生最大化的 詞元收益。這個軟體協調並加速成千上萬個 GPU 的推論通訊,並利用分散式服務,將大型語言模型的處理與生成階段,分配到不同的 GPU 執行。這樣一來,便可針對特定需求單獨將每個階段最佳化,並確保 GPU 資源使用率最大化。
Blackwell 系統非常適合執行全新的 NVIDIA Llama Nemotron Reason 模型與 NVIDIA AI-Q Blueprint,並在 NVIDIA AI Enterprise 軟體平台享有對正式作業環境級AI的支援。NVIDIA AI Enterprise 包含 NVIDIA NIM™ 微服務,以及企業可部署於 NVIDIA 加速雲端、資料中心和工作站的AI架構、函式庫與工具。
Blackwell 平台的建置基礎包括 NVIDIA 強大的開發工具生態系、NVIDIA CUDA-X™ 函式庫、逾 600 萬名開發人員,以及 4,000 多個應用程式,可透過成千上萬顆 GPU 調整效能。
觀看 NVIDIA GTC 主題演講深入瞭解,並報名參加 NVIDIA 與業界領導者在會場舉辦的各項分場活動,活動期間為即日起至 3 月 21 日止。
關於NVIDIA(輝達)
NVIDIA(輝達)為加速運算領域的先驅。
NVIDIA前瞻性聲明
本新聞稿根據目前預期所做出的前瞻性聲明,包含但不限於:NVIDIA的產品和技術;第三方使用或採用 NVIDIA 產品、技術和平台及其優點和影響;Blackwell Ultra可輕鬆高效執行預先訓練、後期訓練與推理AI推論;先進的網路是AI基礎架構的關鍵元件,可提供最佳效能,並減少延遲和抖動程度等。這些前瞻性聲明包含可能導致實質結果與預期不符之風險與不確定因素。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;NVIDIA的產品借重第三方協力廠商之製造、組合、封裝和測試;技術發展和市場競爭之影響;發展新產品與技術或強化現有的產品及技術;NVIDIA或合作廠商的產品的市場接受度;設計、製造或軟體缺陷;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的NVIDIA產品或效能降低之技術缺失,以及NVIDIA定期提交給美國證券交易委員會(SEC)報告中的其他詳細因素,包含但不限於Form10-K的年度報告和Form10-Q的季度報告。NVIDIA 在公司官方網站上免費提供定期提交給SEC的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態。除非法律規定,否則NVIDIA沒有意願或義務因為新資訊、未來事件或其他理由而更新或修改任何前瞻性聲明。
©本文為NVIDIA 公司 2025版權所有,並保留所有權利。NVIDIA、NVIDIA 標誌、BlueField、Connect-X、CUDA-X、DGX、NVIDIA DGX SuperPOD、NVIDIA HGX、NVIDIA Hopper、NVIDIA NIM和NVIDIA Spectrum-X是NVIDIA 公司在美國及其他地區的商標及(或)註冊商標。所有其他公司及產品名稱乃為所屬個別公司之商標。功能、訂價、出貨時程和規格之變更不會另行通知。