NVIDIA GeForce RTX 5090 和 5080 GPU 採用創新的 NVIDIA Blackwell 架構,且透過搭載的 NVIDIA DLSS 4 技術,可將畫面速率提升達 8 倍、NVIDIA Reflex 2 降低延遲,及 NVIDIA RTX 神經渲染增強圖形擬真度。
這些 GPU 的設計專為加速最新的生成式 AI 工作負載,而且可實現 3,352 兆次 AI 運算 (TOPS),為 AI 愛好者、遊戲玩家、創作者和開發人員提供絕佳的體驗。
為協助 AI 開發人員和重度遊戲愛好者利用這些功能,NVIDIA 在上個月的 CES 消費電子展發佈 RTX 平台的 NVIDIA NIM 與 AI Blueprint。NVIDIA NIM 微服務是預先封裝的生成式 AI 模型,所以開發人員和重度遊戲愛好者可輕易著手使用生成式 AI 、快速迭代,並利用 RTX 強大的功能加速 Windows 電腦搭載的 AI 。NVIDIA AI Blueprint 是參考專案,為開發人員示範如何使用 NIM 微服務打造新一代 AI 體驗。
專為 GeForce RTX 50 系列 GPU 最佳化的 NIM 和 AI Blueprint 技術,搭配使用上無比順暢,有助開發人員和重度遊戲愛好者在 AI 電腦打造、迭代、提供先進的 AI 體驗。
NVIDIA NIM 加速電腦搭載的生成式 AI
即使 AI 模型發展迅速,但對多數人來說,這些創新技術要引進電腦應用仍是一大難題。Hugging Face 等平台發布的模型需要調校、量化才能在電腦執行,而且這些模型仍需整合至新的 AI 應用程式介面 (API),才能確保模型與現有工具相容,並轉換為最佳化的推論後端,提供頂尖效能。
RTX AI 電腦與工作站適用的 NVIDIA NIM 微服務,提供社群導向的存取權和 NVIDIA 開發的 AI 模型,有助減輕複雜的 AI 調校流程。這些微服務可輕鬆下載,也可透過業界標準 API 連線,調控 AI 電腦重要的模式。此外,這些微服務與各種 AI 工具相容,所以在電腦、資料中心、雲端均可提供靈活的部署選項。
NIM 微服務提供的功能正是搭載 RTX GPU 的電腦執行最佳化模型所需,包括特定 GPU 專用的預建引擎、NVIDIA TensorRT 軟體開發套件 (SDK)、加速推論的開源 NVIDIA TensorRT-LLM 資料庫 (使用 Tensor 核心) 等。
Microsoft 和 NVIDIA 合作推出 Windows Subsystem for Linux (WSL2) RTX 適用的 NIM 微服務和 AI Blueprint。憑藉 WSL2,資料中心 GPU 執行相同的 AI 容器,目前也可在 RTX 電腦高效執行,方便開發人員跨平台打造、測試、部署 AI 模型。
而且 NIM 和 AI Blueprint 使用 GeForce RTX 50 系列採用的 Blackwell 架構關鍵創新技術,包括第 5 代 Tensor 核心與支援 FP4 精度。
Tensor 核心驅動新一代 AI 效能
AI 運算極其耗能,且需要龐大處理能力。因為 AI 模型每秒仰賴數百兆的數學運算,才能完成生成影像、影片,或是理解語言、即時決策。為了滿足運算需求,電腦要專為 AI 設計硬體。

NVIDIA GeForce RTX GPU 於 2018 年採用專門處理這類密集工作負載的 AI 處理器 — Tensor 核心,顛覆現有技術。不同於傳統運算核心,Tensor 核心可加速運算、提升效率,是專為加速 AI 設計。這項突破促使 AI 技術支援的遊戲、創意工具和生產力應用程式變得普及。
Blackwell 架構則讓 AI 加速邁向全新境界。Blackwell GPU 搭載的第 5 代 Tensor 核心可提供 3,352 兆次 AI 運算,處理更高效能需求的 AI 工作,還能同時執行多個 AI 模型。簡言之是更快的 AI 驅動體驗,而即時渲染、智慧助理則將為遊戲、內容創作等領域開疆闢土。
FP4:模型小、效能高
最佳化 AI 效能的另一種方法是量化技術,縮小模型即可降低記憶體需求,執行得更快。
邁入 FP4:先進的量化格式有助於將 AI 模型變得更精簡、執行速度更快,但不犧牲輸出品質。相較於 FP16,FP4 可將模型縮小達 60%、效能提升兩倍以上,且品質下降可說是微乎其微。
以 Black Forest Lab 的 FLUX.1 [dev] 模型為例,FP16 時 VRAM 需要 23GB 以上,因此只有 GeForce RTX 4090 和專業 GPU 可支援。如果是 FP4,FLUX.1 [dev] 需要的 VRAM 不到 10GB,所以有更多 GeForce RTX GPU 可支援模型於本機執行。
如果 GeForce RTX 4090 採用 FP16,FLUX.1 [dev] 模型 15 秒內需要經過 30 個步驟生成影像。換作採用 FP4 的 GeForce RTX 5090,只要大約 5 秒即可生成影像。
Blackwell 架構原生支援 FP4,所以在本機電腦部署高效能的 AI 是空前簡單。FP4 更整合至微服務,高效最佳化以往不易量化的模型。FP4 實現更高效的 AI 處理,提供內容創作更快、更智慧的 AI 體驗。
AI Blueprint 支援 RTX 電腦的先進 AI 工作流程
NVIDIA AI Blueprint 採用 NIM 微服務提供預先封裝的最佳化參考實例,簡化開發先進 AI 支援的專案,例如數位人類、Podcasts 產生器或應用程式助理。
NVIDIA 在 CES 展示 PDF to Podcast 藍圖,使用者可以將 PDF 轉換為有趣的 Podcast,甚至以 AI 作為 Podcast 主持人進行問答。這個工作流程整合 7 個不同的 AI 模型,同步執行動態的互動體驗。

利用 AI Blueprint,RTX 電腦和工作站的使用者可迅速從實驗轉為開發 AI 。
NIM 與 AI Blueprint 即將登陸 RTX 電腦和工作站
生成式 AI 持續開拓遊戲、內容創作等領域的可能。透過 NIM 微服務和 AI Blueprint, AI 的最新技術已可適用於 RTX 電腦,不再侷限於雲端。透過 RTX GPU,開發人員和重度遊戲愛好者可以直接在電腦和工作站實驗、打造、甚至本機部署 AI 。
即將推出的 NIM 微服務和 AI Blueprint 提供 GeForce RTX 50 系列、GeForce RTX 4090 與 4080、NVIDIA RTX 6000 與 5000 專業 GPU 初始的硬體支援,且日後會支援更多的 GPU。