NVIDIA 宣布推出 Nemotron 模型系列，以推動代理型 AI 的發展

人工智慧（AI）將進入代理式 AI 的新時代，專業代理組成的團隊在這個時代中可以協助人們解決複雜問題與自動執行重複性高的工作。

藉由客製化 AI 代理，各產業的企業可以打造智慧並實現前所未有的生產力。這些先進的 AI 代理需要一套針對代理 AI 功能和能力進行優化的多個生成式 AI 模型。這種複雜性意味著對強大高效的企業級模型的需求從未如此強烈。

為了為企業代理 AI 提供基礎，NVIDIA 於今日發表 Llama Nemotron 開放式大型語言模型（LLM）系列。這些使用 Llama 開發出的模型可以協助開發人員在各種應用程式中建立與部署 AI 代理，包括客戶支援、偵測詐欺活動，以及產品供應鏈與庫存管理最佳化。

許多 AI 代理若要發揮功效，必須同時具備語言技能和感知世界，以及採取適當行動做出反應的能力。

開發人員使用全新的 NVIDIA Cosmos Nemotron 視覺語言模型（VLM）與用於影片搜尋與摘要的 NVIDIA NIM 微服務，便能建立代理程式來分析和回應來自自主機器、醫院、商店與倉庫，以及運動賽事、電影與新聞的圖像與影片內容。針對想要為機器人與自動駕駛車產生物理感知影片的開發人員，NVIDIA 今天另外發表了 NVIDIA Cosmos 世界基礎模型。

開放式 Llama Nemotron 模型可最佳化AI 代理的運算效率與精確度

NVIDIA Llama Nemotron 模型基於 Llama 基礎模型構建，Llama 是最受歡迎且具商業可行性的開源模型集合之一，已被下載超過 6.5 億次。這些模型為 AI 代理開發提供了最佳化的構建模塊。這是基於 NVIDIA 對開發最先進模型的承諾，例如 Llama 3.1 Nemotron 70B，現已透過 NVIDIA API 目錄提供。

採用 NVIDIA 的最新技術與高品質資料集來修剪與訓練 Llama Nemotron 模型，以增強代理能力。它們在指令追蹤、聊天、函式呼叫、編碼和數學方面表現優異，又有最佳的體積大小，可在各種 NVIDIA 加速運算資源上運行。

Meta 副總裁暨 GenAI 部門主管 Ahmad Al-Dahel 表示：「代理型 AI 是 AI 發展下一個前沿，要抓住這一機遇，需要對 LLM 系統進行全堆疊最佳化，以提供高效精確的 AI 代理。我們與 NVIDIA 合作，再加上我們對開放模型的共同承諾，建構在 Llama 上的 NVIDIA Llama Nemotron 系列可協助企業快速建立自己的客製化 AI 代理。」

包括 SAP 和 ServiceNow 在內的領先 AI 代理平台供應商預計先成為首批使用全新 Llama Nemotron 模型的公司之一。

SAP 的 AI 長 Philipp Herzig 表示：「能夠跨越多個業務線合作解決複雜任務的 AI 代理，將超越當今的生成式人 AI 應用場景，將企業生產力提升到一個全新的層次。。數以億計的企業使用者將透過 SAP 的 Joule 與這些代理互動，用更快的速度完成目標。NVIDIA 全新的開放式 Llama Nemotron 模型系列將促進開發多種專門 AI 代理，進而改變業務流程。」

ServiceNow 平台 AI 部門副總裁 Jeremy Barnes 表示：「AI 代理讓組織能夠事半功倍，為業務轉型樹立新標準。NVIDIA 的開放式 Llama Nemotron 模型所提高的效能與精確度，有助於建立先進的 AI 代理服務，解決任何產業跨職能的複雜問題。」

NVIDIA Llama Nemotron 模型使用 NVIDIA NeMo 進行蒸餾、修剪和對齊。運用這些技術讓模型體積小到足以在各種運算平台上執行，同時提供高準確度與更高的模型傳輸量。

將以可下載模型和 NVIDIA NIM 微服務的形式提供 Llama Nemotron 模型系列，可輕鬆部署於雲端、資料中心、個人電腦和工作站。它們可為企業提供領先業界的效能，且能夠可靠安全且完美地整合至其代理型 AI 應用程式工作流程中。

使用 NVIDIA NeMo 客製化與連接業務知識

Llama Nemotron 和 Cosmos Nemotron 模型系列有 Nano、Super 和 Ultra 三個體積大小，提供各種規模的 AI 代理部署選擇。

Nano：成本效益最高的模型，針對低延遲的即時應用程式進行最佳化，非常適合部署在 PC 和邊緣裝置上。
Super：在單一 GPU 上提供卓越傳輸量的高精準度模型。
Ultra：精準度最高的模型，專為要求最高效能的資料中心規模應用而設計。

企業還能使用 NVIDIA NeMo 微服務針對特定的使用個案與領域客製化模型，以簡化資料管理、加速模型客製化與評估，並且應用防護機制以確保回應順利進行。

開發人員使用 NVIDIA NeMo Retriever，還可以整合檢索增強生成（RAG）功能，將模型與企業資料串連起來。

而企業使用適用於代理型 AI 的 NVIDIA Blueprints，可以利用 NVIDIA 先進的 AI 工具及端對端開發專業技術，快速建立自己的應用程式。事實上，NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 與 NeMo Retriever 為今日另行發表的全新適用於影片搜尋和摘要的 NVIDIA Blueprint 功能增添了強大動力。

NeMo、NeMo Retriever 與 NVIDIA Blueprints 皆可透過 NVIDIA AI Enterprise 軟體平台使用。

上市時間

Llama Nemotron 和 Cosmos Nemotron 模型將即將以託管 API 的形式提供，可在 build.nvidia.com 和 Hugging Face 下載使用。NVIDIA 開發人員計畫的成員可免費取得以進行開發、測試與研究。

企業可以使用 NVIDIA AI Enterprise 軟體平台，在加速資料中心與雲端基礎架構上，在生產環境中運行 Llama Nemotron 與 Cosmos Nemotron NIM 微服務。

註冊以獲得關於 Llama Nemotron 及 Cosmos Nemotron 模型的通知，並且參加 NVIDIA 在 CES 大會的精彩活動。

請見有關軟體產品資訊的通知。