NVIDIA 推出 Rubin CPX，專為大規模情境推論而打造的新一代 GPU

【2025 年 9 月 9 日，美國聖塔克拉拉訊】NVIDIA今日宣布推出 NVIDIA Rubin CPX，一款專為大規模情境（context）處理而打造的新一代 GPU。Rubin CPX 使得人工智慧（AI）系統能以突破性的速度與效率，處理百萬個詞元（token）的軟體編碼與影片生成。

Rubin CPX 與全新NVIDIA Vera Rubin NVL144 CPX 平台中的 NVIDIA Vera CPU 和 Rubin GPU 協同工作。這款整合式 NVIDIA MGX 系統在單一機架配置下擁有 8 exaflops 的 AI 運算能力，可提供比 NVIDIA GB300 NVL72 系統高出 7.5 倍的 AI 效能，同時配備 100 TB 快速記憶體及每秒 1.7 PB 的記憶體頻寬。NVIDIA也將提供一個專屬的Rubin CPX 運算托盤（compute tray），以滿足客戶希望重複利用現有Vera Rubin 144 系統的需求。

NVIDIA 創辦人暨執行長黃仁勳表示：「Vera Rubin 平台將標誌著 AI 運算領域的又一次躍進，不僅推出新一代 Rubin GPU，更創造名為 CPX 的全新處理器類別。正如 RTX 為圖形與物理 AI 領域帶來革命性的改變，Rubin CPX 是首款專為大規模情境 AI 打造的 CUDA GPU，能讓模型同時處理具備數百萬個詞元的推理任務。」

NVIDIA Rubin CPX 可在處理長情境時提供最高效能與詞元收益，遠超當今系統設計所能承載的範疇。這讓 AI 程式碼助理從簡單的程式碼生成工具，轉型為可理解並最佳化大型軟體項目的複雜系統。

AI 模型可能需要使用多達 100 萬個詞元來處理一小時內容的影片，這已經達到傳統 GPU 運算的極限。Rubin CPX 將影片解碼器與編碼器，以及長情境推論處理技術整合至單一晶片，為影片搜尋與高品質生成影片等長格式應用，實現前所未有的功能。

Rubin CPX GPU 採用 NVIDIA Rubin 架構，採用經濟實惠的單晶片設計，搭載強大的 NVFP4 運算資源，並經過最佳化，可為 AI 推論任務提供極高的效能與能源效率。

Rubin CPX 帶來的進步

Rubin CPX 以 NVFP4 精度技術提供高達 30 petaflops 的運算能力，實現最高效能與準確性。其採用 128 GB 經濟實惠的 GDDR7 記憶體，可加速處理要求最嚴苛、基於情境的工作負載。此外，與 NVIDIA GB300 NVL72 系統相比，Rubin CPX 的系統專注力提升 3 倍，在不減緩速度的情況下，大幅提高 AI 模型處理更長情境序列的能力。

Rubin CPX 提供多種配置選項，包括 Vera Rubin NVL144 CPX，可結合 NVIDIA Quantum‑X800 InfiniBand 橫向擴展運算架構，或是搭配採用 NVIDIA Spectrum-XGS 乙太網路技術與 NVIDIA ConnectX®-9 SuperNICs™ 的 NVIDIA Spectrum-X™ 乙太網路平台。透過 Vera Rubin CPX，企業得以實現前所未有的盈利規模，每投資 1 億美元即可獲得 50 億美元的詞元收益。

業界領袖選擇 Rubin CPX

AI 創新者正探索如何以Rubin CPX 加速其應用，涵蓋從大規模軟體開發到動態視覺內容分析，以便更深入瞭解動態影像。

Cursor 是一家提供高階程式碼編輯器的 AI 軟體公司，該公司認為 Rubin CPX 的優勢在於能夠直接在程式碼環境中，透過智慧型程式碼生成與協作工具，大幅提高開發人員工作效率。

Cursor 執行長 Michael Truell 表示：「借助 NVIDIA Rubin CPX，Cursor 將能提供如閃電般快速的程式碼生成與開發人員洞察，從而徹底改變軟體創作方式。這將把工作效率提升至新高度，並讓使用者能夠將過去無法實現的創意付諸實踐。」

美國生成式 AI 公司 Runway 將採用 NVIDIA 技術，幫助創作者以無與倫比的規模與效率，製作出具有電影質感的內容與尖端的視覺效果。

Runway 執行長 Cristóbal Valenzuela 表示：「影片生成技術正迅速發展，朝向情境更長且更靈活的代理驅動創意工作流程。我們認為 Rubin CPX 是效能上的重大突破，可支援這些要求嚴苛的工作負載，進而建構更通用且智慧的創意工具。這意味著從獨立藝術家到大型工作室的創作者，都可以在作品中獲得前所未有的速度、真實感與掌控力。」

Magic 是一家正在開發基礎模型的 AI 研究與產品公司，以驅動可自動化軟體工程的 AI 代理。

Magic 執行長 Eric Steinberger 表示：「透過包含 1 億個詞元的情境窗口，我們的模型無需微調即可完整查看程式碼庫、多年互動歷史、文件與函式庫的情境。這項技術讓使用者能在測試階段時透過對話和存取環境來訓練代理，讓我們更接近自主代理體驗。採用 NVIDIA Rubin CPX 這類 GPU 技術，可大幅加速我們的運算工作負載。」

軟體支援

NVIDIA Rubin CPX 將獲得完整的 NVIDIA AI 技術堆疊支援，從加速基礎設施到企業級軟體皆涵蓋其中。NVIDIA Dynamo 平台可高效擴充 AI 推論，在大幅提高輸送量的同時，縮短回應時間並降低模型服務成本。

這些處理器將能夠執行 NVIDIA Nemotron™ 系列最新的多模態模型，為企業級 AI 代理提供最先進的推理技術。針對生產級 AI 應用，Nemotron 模型可透過 NVIDIA AI Enterprise 軟體平台交付。該平台包含 NVIDIA NIM™ 微服務，以及 AI 框架、程式庫與工具，企業可將其部署於 NVIDIA 加速的雲端、資料中心與工作站。

Rubin 平台以數十年的創新為基礎，拓展 NVIDIA 開發人員生態系，並提供 NVIDIA CUDA‑X™ 程式庫、逾 600 萬人的開發人員社群，以及近 6,000 種 CUDA 應用程式。

上市時程

NVIDIA Rubin CPX 預計於 2026 年底上市。

如欲了解進一步資訊，歡迎觀看 NVIDIA 超大規模與高效能運算副總裁 Ian Buck 於美西時間 9 月 9 日上午 10:00 在 AI Infra Summit 上的主題演講。

關於 NVIDIA

NVIDIA（輝達）為加速運算領域的先驅。

本新聞稿根據目前預期所做出的前瞻性聲明，包含但不限於：Vera Rubin 系統持續展現非凡效能與效率；透過 Rubin CPX 打造出為百萬詞元情境處理量身打造的 GPU，大幅降低推論成本，為全球開發者與創作者開啟先進功能；NVIDIA 產品、服務與技術的優勢、影響、效能與可用性；對 NVIDIA 第三方安排的期望，包括對其協作夥伴與合作夥伴的期望；對技術開發的期望；以及其他非歷史事實的前瞻性聲明，依據修訂後的 1933 年《證券法》第 27A 條，以及修訂後的 1934 年《證券交易法》第 21E 條規定，這些聲明係根據管理階層的信念與假設，以及管理階層目前可取得的資訊，並受這些條款所制定的「安全港」約束，同時面臨各種風險與不確定性，實際結果可能與預期落差極大。可能導致實際結果差異極大的重要因素包括：全球經濟狀況與政局；NVIDIA 對第三方製造、組裝、封裝與測試 NVIDIA 產品的依賴；技術發展與競爭的影響；新產品與技術開發，或是對 NVIDIA 現有產品與技術的改良；NVIDIA 產品或 NVIDIA 合作夥伴產品的市場接受度；設計、製造或軟體瑕疵；消費者喜好或需求變動；產業標準與介面改變；NVIDIA 的產品或技術整合至系統時，發生意外的效能損失；適用法律與法規改變，以及 NVIDIA 不定時向證券交易委員會（SEC）呈報之最新報告中詳述的其他因素，包括但不限於 Form 10-K 年度報告和 Form 10-Q 季度報告詳述的因素。向 SEC 呈報的報告複本已在公司網站發布，可以向 NVIDIA 免費索取。這些前瞻性聲明不保證未來效能，且僅反映本文發布日期的情況，而且除法律規定，NVIDIA 不承擔任何義務，無須為反映未來事件或情況而更新這些前瞻性聲明。