NVIDIA 加速企業客製化生成式人工智慧模型的開發

開發者可以直接從瀏覽器中嘗試新的 NVIDIA AI Foundation Models,然後在其應用程式中使用 NVIDIA AI Foundation 端點進行測試,最後使用其獨特的業務資料進行客製化調整
作者 Erik Pounds

當今的免費、開源大型語言模型環境對企業來說就像是無限自助餐。這樣的豐富選擇對於正在開發客製化生成式人工智慧應用程式的開發者來說可能讓人不知所措,因為他們需要應對獨特的專案和業務需求,包括相容性、安全性以及用來訓練模型的資料。

NVIDIA AI Foundation Models 是企業級預訓練模型的精選集合,為開發人員提供將客製化生成式人工智慧帶入他們企業的良好開端。

NVIDIA 最佳化的基礎模式加速創新

NVIDIA AI Foundation Models 可以透過簡單的使用者介面或 API 直接從瀏覽器體驗。此外,這些模型可以從 NVIDIA AI Foundation Endpoints 獲得,以測試企業應用程式中的效能。

可獲得的模型包括領先的社群模型,如 Llama 2、Stable Diffusion XL 和 Mistral,它們已經經過格式化,以協助開發者使用專有資料來加速客製化流程。此外,這些模型已經經過 NVIDIA TensorRT-LLM 的最佳化,以實現最高的吞吐量和最低的延遲,並且可以在任何 NVIDIA GPU 加速堆疊上大規模運行。例如,使用 TensorRT-LLM 最佳化的 Llama 2 模型在 NVIDIA H100 上的運行速度提高了近 2 倍。

新的NVIDIA Nemotron-3 8B 模型系列支援創建當今最先進的企業聊天和問答應用程式,適用於包括醫療保健、電信和金融服務等廣泛的行業。

這些模型是協助客戶建立安全、可立即上線使用的生成式人工智慧應用程式的起始點。 這些模型在來源可靠的資料集上進行訓練,並以與更大模型相媲美的效能運行,這使得它們非常適合企業部署。

多語言功能是 Nemotron-3 8B 型號的關鍵區別。這些模型開箱即用,精通 50 多種語言,包括英語、德語、俄語、西班牙語、法語、日語、中文、韓語、義大利語和荷蘭語。

加速客製化到部署

跨業務功能利用生成式人工智慧的企業需要人工智慧代工廠為其獨特的應用程式客製化模型。 NVIDIA 的人工智慧代工廠有三個要素:NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具以及 NVIDIA DGX Cloud 超級運算服務。 這些共同提供了用於創建客製化生成式人工智慧模型的端到端企業產品。

重要的是,企業擁有自己的客製化模型,並且可以使用 NVIDIA AI Enterprise 軟體將其部署在幾乎任何加速運算的場域上,並具有企業級安全性、穩定性和支援。

NVIDIA AI Foundation Models 可在 NVIDIA NGC 目錄和 Hugging Face 上免費試驗,也託管於 Microsoft Azure 人工智慧模型目錄中。