VMware 與 NVIDIA 為企業開啟生成式 AI 時代

全新 VMware Private AI Foundation with NVIDIA 使企業能夠為生成式人工智慧做好準備;該平台將進一步在資料隱私性、安全性和可控性等方面提供支援
作者 NVIDIA Corporation

VMware Inc.(NYSE: VMW)和NVIDIA(NASDAQ:NVDA)今天宣布擴大策略合作夥伴關係,讓在 VMware 雲端基礎設施上運行的數十萬家企業為生成式 AI 時代做好準備。

VMware Private AI Foundation with NVIDIA 將使企業能夠自定義模型並運行生成式人工智慧應用程式,包括智慧聊天機器人、助理、搜尋和摘要生成等。該平台將是一個全面整合的解決方案,具備來自 NVIDIA 的生成式人工智慧軟體和加速運算,建立在 VMware Cloud Foundation 上,並針對人工智慧進行了最佳化。

VMware 執行長 Raghu Raghuram 表示:「生成式人工智慧和多雲環境是完美的結合。客戶資料無處不在,存在於他們的資料中心、邊緣設備和雲端中。與 NVIDIA 合作,我們將使企業能夠放心地在其資料附近運行生成式人工智慧工作負載,同時解決企業對資料隱私、安全和可控性的擔憂。」

NVIDIA 創辦人暨執行長黃仁勳表示:「世界各地的企業都在競相將生成式人工智慧與其業務整合。我們與 VMware 的擴大合作將為金融服務、醫療保健、製造等領域數十萬客戶,提供他們所需的全端軟體和運算,以使用透過自有資料構建的自定義應用程式來釋放生成式人工智慧的潛力。」

全端運算增強生成式人工智慧效能

為了更快地獲得業務效益,企業正在尋求簡化生成式人工智慧應用的開發、測試和部署流程。麥肯錫估計,生成式人工智慧每年可能為全球經濟增加多達 4.4 兆美元的價值。(1)

VMware Private AI Foundation with NVIDIA 將使企業能夠利用這種能力,定制大型語言模型,為其內部使用生成更安全和私有的模型,向其使用者提供生成式人工智慧服務,並且更安全地大規模運行推論工作負載。

該平台預計將包括整合的人工智慧工具,使企業能夠以具成本效益的方式運行在其私有資料上訓練的經過驗證的模型。該平台將建立在 VMware Cloud Foundation 和 NVIDIA AI Enterprise 軟體之上,預期效益包括:

  • 隱私 — 使客戶能夠在擁有資料的任何地方輕鬆運行人工智慧服務,並採用保護資料隱私和安全訪問的架構。
  • 選擇 — 企業將在建立和運行其模型的地點上有廣泛的選擇 — 從 NVIDIA NeMo™ 到 Llama 2 及更高版本 — 包括領先的 OEM 硬體配置,並在未來還可能涵蓋公有雲和服務供應商的方案。
  • 效能 — 正如最近產業基準測試所證明的,在某些使用案例中,在 NVIDIA 加速基礎設施上運行將提供等於甚至超過裸機的效能。
  • 資料中心規模 — 虛擬化環境中的 GPU 擴展優化,可讓人工智慧工作負載在單一虛擬機器中擴充至 16 個 vGPU/GPU,並跨越多個節點以加速生成式AI模型的微調與部署。
  • 降低成本 — 將最大程度地利用跨 GPU、DPU 和 CPU 的所有運算資源,降低整體成本,並建立一個可在團隊之間有效共享的資源池環境。
  • 加速儲存 — VMware vSAN Express 儲存架構 (Express Storage Architecture,ESA) 將提供性能優化的 NVMe 儲存,並支援基於 RDMA 的 GPUDirect® 儲存,允許從儲存直接 I/O 傳輸到 GPU,無需 CPU 參與。
  • 加速網路 — vSphere 與 NVIDIA NVSwitch™ 技術之間的深度整合將進一步實現多 GPU 模型的執行,而不會有 GPU 之間的瓶頸問題。
  • 快速部署和價值實現 — vSphere 深度學習 VM 映像檔和映像庫透過提供穩定的一站式解決方案(包括預安裝的框架和效能最佳化庫),支援快速原型製作功能。

該平台將提供 NVIDIA AI Enterprise 中包含的端到端雲原生框架 NVIDIA NeMo,而 NVIDIA AI Enterprise 是 NVIDIA 人工智慧平台的操作系統,它使企業能夠在幾乎任何地方構建、定制和部署生成式人工智慧模型。NeMo結合了定制框架、護欄工具包、資料內容篩選工具和預訓練模型,為企業提供了一種簡單、具成本效益且快速的方式來採用生成式人工智慧。

為了在生產中部署生成式人工智慧,NeMo 使用 TensorRT for Large Language Models(TRT-LLM),它可以加速和優化 NVIDIA GPU 上最新大型語言模型的推論性能。借助 NeMo,VMware Private AI Foundation with NVIDIA 將使企業能夠將自己的資料導入其中,在 VMware 的混合雲基礎設施上構建和運行自定義生成式人工智慧模型。

在 VMware Explore 2023 大會上,NVIDIA 和 VMware 將重點介紹企業內的開發人員如何使用新的 NVIDIA AI Workbench 來提取社群模型(例如 Hugging Face 上提供的 Llama 2)、遠端自訂它們以及在 VMware  環境中部署生產級生成式人工智慧。

VMware Private AI Foundation with NVIDIA的廣大生態系統支持

技術將得到戴爾科技集團、慧與科技公司和 Lenovo 將支援 VMware Private AI Foundation with NVIDIA,它們將成為率先採用 NVIDIA L40S GPUNVIDIA BlueField®-3 DPUNVIDIA ConnectX®-7 SmartNICs 提供增強企業大型語言模型定制和推論工作負載的系統。

與 NVIDIA A100 Tensor Core GPU 相比,NVIDIA L40S GPU 的生成式人工智慧推理效能提高了 1.2 倍,訓練性能提高了 1.7 倍。

NVIDIA BlueField-3 DPU 能夠加速、卸載和區隔虛擬化、網路、儲存、安全以及其他雲原生AI服務所帶來的大量運算負載,從而減輕 GPU 或 CPU 的負擔。

NVIDIA ConnectX-7 SmartNIC 則為資料中心基礎設施提供智慧加速的網路功能,以提升世界上一些要求最嚴苛的 AI 工作負載。

VMware Private AI Foundation with NVIDIA 是建立在雙方長達十年的合作夥伴關係之上。 他們的共同工程工作優化了 VMware 的雲端基礎設施,以運行 NVIDIA AI Enterprise,其性能可與裸機相媲美。共同客戶進一步受益於 VMware Cloud Foundation 提供的資源和基礎架構管理以及靈活性。

上市時間

VMware 計劃於 2024 年初與 NVIDIA 一同發布 VMware Private AI Foundation with NVIDIA。

掌握 NVIDIA 最新動態

請訂閱 NVIDIA 官方部落格或追蹤 FacebookTwitterLinkedInInstagram。瀏覽 NVIDIA 相關影片及圖片,請至 YouTubeFlickr

About VMware

VMware is a leading provider of multi-cloud services for all apps, enabling digital innovation with enterprise control. As a trusted foundation to accelerate innovation, VMware software gives businesses the flexibility and choice they need to build the future. Headquartered in Palo Alto, California, VMware is committed to building a better future through the company’s 2030 Agenda. For more information, please visit www.vmware.com/company.

關於 NVIDIA (輝達)

NVIDIA (輝達) 自 1999 年發明 GPU 起便成功促進 PC 電競市場的成長,並重新定義現代電腦繪圖、高效能運算與人工智慧。NVIDIA 在加速運算和人工智慧領域的開創性成就,正重塑多個市場規模高達數兆美元的產業,如交通運輸、健康醫療和製造業,亦同時促進許多其他產業的成長。欲瞭解更多資訊,請瀏覽 https://blogs.nvidia.com.tw

新聞聯絡人

NVIDIA
資深公關經理 王懷璐
電話:(02)6605-5700
E-mail: Kate Wang
霍夫曼公關
王一中/劉潔
行動電話: 0934-191-532 / 0961-106-610
E-mail: Stephen Wang/Claire Liu

本新聞稿根據目前預期所做出的前瞻性聲明,包含但不限於:NVIDIA的產品、服務和技術的優勢和影響。這些前瞻性聲明包含可能導致實質結果與預期不符之風險與不確定因素。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;NVIDIA 的產品借重第三方協力廠商之製造、組合、封裝和測試;技術發展和市場競爭之影響;發展新產品與技術或強化現有的產品及技術;NVIDIA或合作廠商的產品的市場接受度;設計、製造或軟體缺陷;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的NVIDIA產品或效能降低之技術缺失,以及NVIDIA定期提交給美國證券交易委員會(SEC)報告中的其他詳細因素,包含但不限於Form10-K的年度報告和Form10-Q的季度報告。NVIDIA 在公司官方網站上免費提供定期提交給SEC的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態。除非法律規定,否則NVIDIA沒有意願或義務因為新資訊、未來事件或其他理由而更新或修改任何前瞻性聲明。

本文為 NVIDIA 公司 2023 版權所有並保留所有權利。NVIDIA、NVIDIA標誌、NVIDIA Grace Hopper、NVIDIA MGX和NVLink是NVIDIA公司在美國及(或)其他地區的商標和(或)註冊商標。所有其他公司及產品名稱乃為所屬個別公司之商標。功能、定價、出貨時程和規格之變更不會另行通知。