完美套件:NVIDIA 和 VMware 提供 AI 就緒企業平台

作者 NVIDIA

當企業將資料中心現代化,以支援 AI 驅動應用程式和資料科學時,NVIDIA 和 VMware 即可使在現代混合雲端開發和部署多種不同的 AI 工作負載,變得比以往更容易。

兩家公司合作,透過 (請參見下方圖 1),針對 AI 應用程式將剛發表的 vSphere 更新-VMware vSphere 7 Update 2 最佳化。此結合可為各種加速 CUDA 應用程式、AI 框架、模型和 SDK,實現橫向擴充多節點效能和相容性,造福使用 vSphere 進行伺服器虛擬化的數十萬家企業。

AI 研究人員、資料科學家和開發人員透過此前所未有的業界合作,可以獲得交付成功之 AI 專案需要的軟體,而 IT 專業人員則能使用他們最熟悉的工具支援 AI,以管理大規模資料中心,而不會犧牲其他層面。

圖 1:NVIDIA AI Enterprise for VMware vSphere 是在 NVIDIA-Certified Systems 上執行,使 IT 可以輕鬆地大規模部署虛擬化 AI。

適用於 AI 企業的單一套件

NVIDIA AI Enterprise 是屬於全面的企業級 AI 工具和框架套件,可以協助製造、物流、金融服務、零售、醫療等各種主要產業,將業務流程最佳化,並提高效率。科學家和 AI 研究人員可以透過 NVIDIA AI Enterprise,輕鬆存取 NVIDIA 的先進 AI 工具,以推動開發先進診斷、智慧工廠、詐騙偵測等專案的 AI。

此解決方案已克服了部署個別 AI 應用程式的複雜性,以及必須手動布建與管理通常不相容的不同應用程式和基礎架構軟體,而可能會導致的潛在故障。

由於 NVIDIA AI Enterprise 是在 vSphere上執行,因此客戶可以避免難以管理和保護的 AI 專用系統孤島。他們也可以緩解影子 AI 部署的風險,在此類部署中,資料科學家和機器學習工程師可以在 IT 生態系統之外取得資源。

由 NVIDIA 授權的 AI Enterprise for vSphere 是在 上接受支援,包括 Dell Technologies、HPE、Lenovo 和 Supermicro 的主流伺服器。因此,即使是最現代、需求最高的 AI 應用程式,也可以如同通用基礎架構上的傳統企業工作負載一樣輕易獲得支援,並使用 VMware vCenter 等資料中心管理工具。

IT 可以管理可用性、最佳化資源分配,並針對在內部部署以及在混合雲端執行的 AI 工作負載,確保寶貴之 IP 和客戶資料的安全性。

可擴充多節點虛擬化 AI 效能

NVIDIA AI Enterprise 使虛擬工作負載可以在 vSphere 上,以接近裸機的效能執行,並為 AI 和資料科學提供 GPU 之破紀錄的效能(請參見下方圖表 1)。現在,AI 工作負載已可跨多個節點進行擴充,甚至可以在 VMware Cloud Foundation 上執行最大的深度學習訓練模型。

圖表 1:分散式深度學習訓練可以透過 NVIDIA AI Enterprise for vSphere,跨多個節點進行線性擴充,並提供媲美裸機的效能。

AI 工作負載大小各異,並具有各種資料需求。某些工作負載是處理影像,例如即時路況報告系統或線上購物推薦系統。其他工作負載則是以文字為基礎,例如搭載對話式 AI 的客戶服務支援系統。

訓練 AI 模型可能需要處理極龐大的資料,且需要多個節點中之多個 GPU 的橫向擴充效能。在部署中的模型上執行推論,通常需要的運算資源較少,且可能不需要整個 GPU 的能力。

vSphere 是唯一透過 NVIDIA 與 VMware 之間的合作,利用 技術,為即時移轉提供超管理器支援的伺服器虛擬化軟體。MIG 可以在硬體層級,將每一個 A100 GPU 分成多達七個執行個體,以將大小各異的工作負載效率最大化。

AI 應用程式和基礎架構的豐富資源

NVIDIA AI Enterprise 包含來自 NVIDIA 的關鍵技術和軟體,可以迅速部署、管理和擴充在 VMware Cloud Foundation 上執行的虛擬化資料中心 AI 工作負載。

圖 2:NVIDIA AI Enterprise 是經認證之端對端套件,包含關鍵的 NVIDIA AI 技術和應用程式,以及企業支援服務。

採用 NVIDIA AI Enterprise 的客戶想要升級至 vSphere 7 U2 時,可以 討論需求。

欲深入瞭解如何將 AI 帶入以 VMware 為基礎的資料中心,請參閱 和 VMware vSphere 7 U2 部落格