NVIDIA AI 在語音、推薦系統與超大規模推論取得重大進展

作者 NVIDIA

NVIDIA (輝達) 今天宣布 NVIDIA 人工智慧 (AI) 平台將進行重大更新,該平台為一套用於推動語音處理、推薦系統與超大規模推論等作業負載的軟體,現已被亞馬遜 (Amazon)、微軟 (Microsoft)、 Snap 與日本電信電話等全球產業領導者採用。

NVIDIA 亦宣布將啟動 NVIDIA® AI 加速計畫,其有助於確保由 NVIDIA 軟體與解決方案合作夥伴所開發的 AI 應用程式的效能和可靠性。該計畫讓多款經驗證的 AI 加速應用程式被更多人看見,企業客戶可以安心地在 NVIDIA AI 平台上進行部署。在啟動這項計畫之際,便有包括 Adobe、Red Hat 與 VMware 等超過百家合作夥伴加入。

NVIDIA 創辦人暨執行長黃仁勳表示:「NVIDIA AI 是提供全球 AI 社群使用的軟體工具箱,從 AI 研究人員和資料科學家,到資料和機器學習運作團隊。我們在 GTC 2022 大會中宣布許多重磅消息,無論是打造更具吸引力的聊天機器人和虛擬助理、建立更聰明的推薦內容以協助消費者做出更好的購買決定,或者大規模編排各項 AI 服務,NVIDIA AI 平台是每個人的最佳選擇。」

NVIDIA AI 供開發人員免費使用,包括用於語音 AI 的 NVIDIA Riva,以及用於智慧推薦的 NVIDIA Merlin 皆已正式推出。軟體套件也進行了更新,包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具套件等。

此外,NVIDIA AI Enterprise 2.0 已完成最佳化調整與認證,並支援各大資料中心和雲端平台,包括裸機伺服器、虛擬化基礎架構和純 CPU 系統。該套件現已支援 Red Hat OpenShiftVMware vSphere with Tanzu

透過軟體工具打造業界頂尖的 AI 應用程式

NVIDIA AI 提供重要的 SDK 及工具,於多個節點上快速部署、管理和擴展 AI 作業負載,以支援執行複雜的訓練和機器學習作業負載。這些 SDK 及工具包括:

  • NVIDIA Triton:NVIDIA Triton 是一個多功能的開放原始碼超大規模模型推論解決方案。最新版本包含三大更新項目:用於加速部署完成最佳化模型的 Model Navigator、在 Kubernetes 中進行高效擴展的 Management Service,以及用於樹狀模型上進行推論的森林推論函式庫 (Forest Inference Library),該推論函式庫可在每個應用程式中實現快速、最佳化和可擴充的 AI 可解釋性。
  • NVIDIA Riva 2.0:這是一款世界級的語音 AI SDK,其中預訓練的模型具備領先業界的辨識率,協助開發人員為自身產業量身打造即時語音 AI 應用程式,其準確率較一般服務提升兩倍。Riva 2.0 可辨識七種語言的語音、如真人般具備男聲和女聲並以深度學習為基礎的文字轉語音,以及利用 NVIDIA TAO 工具套件進行客製化調整。NVIDIA 亦宣布將推出付費使用的 NVIDIA Riva Enterprise,包括 NVIDIA 的企業服務支援。
  • NVIDIA NeMo Megatron 0.9:作為訓練大型語言模型 (LLM) 的框架,NeMo Megatron 使研究人員與企業能夠訓練任何模型至收斂的程度,並擴大到數兆個參數,以用於對話式 AI、推薦系統及基因組學等應用項目。最新版本包括全新最佳化調整和製程配方,縮短端到端的開發和訓練時間,亦加入雲端訓練支援。早期使用 NVIDIA 加速運算技術來訓練 LLM 的客戶包括京東、AI Sweden、Naver 及佛羅里達大學。
  • NVIDIA Merlin 1.0:這是一個加速端到端推薦系統的 AI 框架,可以大規模建立高效能推薦系統,其包含兩個新的函式庫:Merlin 模型和 Merlin 系統。資料科學家和機器學習工程師使用這兩個函式庫便能判斷哪些功能和模型最適合其使用場景,並將推薦系統管道部署成微服務。
  • NVIDIA Maxine:這是一款影音品質增強 SDK,透過 AI 來重塑即時通訊,亦加入回聲消除和音訊超解析度兩項全新功能,帶來更清晰的通訊體驗。

客戶採用 NVIDIA AI

產業領導者正使用 NVIDIA AI 來提高成本效率、創造更具吸引力的客戶體驗,同時取得最佳的 AI 應用程式功能。

Snap 對話式 AI 部門負責人 Alan Bekker 表示:「Snapchat 的社群用戶每天使用 Lens 功能的次數超過 60 億次。Snap 使用 NVIDIA Riva 來最佳化各項 AI 語音功能,並將其提供給 Lens Studio 的創作者,以協助創造出新一代更引人入勝的 AR 使用體驗。」

微軟技術研究員暨 Azure AI 部門技術長黃學東表示:「微軟 Azure 認知服務 Translator 裡的文件翻譯功能,可在翻譯文件的同時,保留來源文件的格式和結構,以創造企業與客戶間的高效互動。我們使用 NVIDIA Triton 便能部署最新的 Z-Code 模型,在低延遲的情況下大幅提高文件翻譯品質,提供絕佳的翻譯服務給用戶。」

NVIDIA AI Enterprise 支援跨資料中心和雲端的容器化 AI

NVIDIA AI Enterprise 2.0 軟體套件是一套端到端、雲端原生的 AI 及資料分析工具和框架,能夠協助各產業加速開發與部署 AI。在領先業界的企業 Kubernetes 平台 Red Hat OpenShift 的認證下,客戶能夠使用容器化的機器學習工具,透過 VMware vSphere,更輕鬆地在裸機或虛擬化系統上建立、擴展與共享模型。

Red Hat 合作夥伴生態系成功部門資深副總裁 Stefanie Chiras 表示:「Red Hat OpenShift 對 NVIDIA AI Enterprise 的認證,以及 OpenShift 在 NVIDIA LaunchPad 上的可用性,將開發 AI 的頂級工具與一致化的混合式雲端基礎結合。如今,IT 團隊與資料科學家可在 Red Hat OpenShift 上建立和管理 NVIDIA AI,協助企業加速將智慧應用程式投入生產。」

NVIDIA AI Enterprise 2.0 亦引入更多 NVIDIA AI 軟體容器來支援訓練和推論。支援 NVIDIA TAO 工具套件讓企業的開發人員無須擁有 AI 專業知識或大量訓練資料,便能對 NVIDIA 預訓練 AI 模型進行微調和最佳化,進而簡化建立客製化、可投入生產的模型。該軟體套件還包括最新版本的 NVIDIA Triton 推論伺服器。

NTT 集團旗下領先全球的資通訊技術解決方案供應商 NTT Communications 已採用 NVIDIA AI Enterprise,協助其研發團隊加速打造 NLP 及智慧影像分析應用程式。

NTT Communications 創新中心技術部門總監 Shoichiro Henmi 表示:「許多我們的應用程式開發人員都正在使用加速運算技術,並且需要一個內部基礎架構提供易用、具成本效益並支援 GPU 的環境。我們相信 NVIDIA AI Enterprise 將提供一個理想的解決方案,作為支持 AI 的平台,在我們的 VMware vSphere、Kubernetes 和雲端基礎架構中支援大規模的開發作業。」

客戶可授權 NVIDIA AI Enterprise 在 NVIDIA 認證系統上運行,亦可在頂尖製造商如思科 (Cisco)、戴爾科技 (Dell Technologies)、H3C、慧與科技 (Hewlett Packard Enterprise;HPE)、Inspur、聯想 (Lenovo)、Nettrix 及美超微 (Supermicro) 等未搭載 NVIDIA GPU 的相同伺服器型號上運行。

企業還能選擇在全球 Equinix International Business Exchange™ (IBX®) 資料中心託管的伺服器上進行部署。現亦支援 Amazon Web Services (AWS)、Google Cloud 與微軟 Azure 的雲端執行個體。NVIDIA AI Enterprise 包含在 NVIDIA DGX 系統內。

供應時程

NVIDIA 開發人員計畫中,開發人員可以使用 NVIDIA 的 AI 系列軟體。

企業可以在 NVIDIA LaunchPad 上為 IT 團隊和 AI 開發人員精心策劃的實驗室中,體驗 NVIDIA AI 軟體。NVIDIA LaunchPad 是由全球九個 Equinix IBX 資料中心的 Equinix Metal 服務免費提供的託管項目。全新 LaunchPad 實驗室包括針對 Riva 的語音 AI 實驗室,以及具備 Red Hat OpenShift、VMware vSphere with Tanzu、TAO 工具套件和具 FIL 後端的 Triton 推論伺服器的 NVIDIA AI Enterprise 實驗室

敬請觀看黃仁勳先生的 GTC 2022 主題演講,獲得更多關於 NVIDIA AI 的資訊。免費報名 GTC 2022 大會,參加由 NVIDIA 及業界領導者主講的議程。

掌握 NVIDIA 最新動態

請訂閱 NVIDIA 官方部落格或追蹤 FacebookTwitterLinkedInInstagram。瀏覽 NVIDIA 相關影片及圖片,請至 YouTubeFlickr

關於 NVIDIA (輝達)

NVIDIA (輝達) 自 1999 年發明 GPU 起便成功促進 PC 電競市場的成長,並重新定義現代電腦繪圖、高效能運算與人工智慧。NVIDIA 在加速運算和人工智慧領域的開創性成就,正重塑多個市場規模高達數兆美元的產業,如交通運輸、健康醫療和製造業,亦同時促進許多其他產業的成長。欲瞭解更多資訊,請瀏覽 https://blogs.nvidia.com.tw

新聞聯絡人

NVIDIA
亞太公關總監 杜佳祐
電話:(02)6605-5856
傳真:(02)8751-1809
E-mail: Melody Tu
世紀奧美公關顧問
蔡宜真/黃晨瑀/詹淑君
電話:(02) 7745-1688
分機 135/128/133
傳真:(02) 7743-9199
行動電話: 0970504933/0931309553/ 0975251507
E-mail: Salin Tsai/ Bonnie Huang/ Shirley Chan

本新聞稿可能包含 NVIDIA 根據目前預期所做出的前瞻性聲明:包含 NVIDIA Triton 推論伺服器、NVIDIA Riva 2.0、NVIDIA NeMo Megatron 0.9、NVIDIA Merlin 1.0、NVIDIA Maxine、NVIDIA AI Enterprise 2.0 及 NVIDIA AI 加速計畫在內的 NVIDIA AI 平台的效益、影響、效能與供應時程;NVIDIA AI 為開發人員及企業提供建立應用程式所需的工具,以協助幾乎各產業轉型;我們的軟體協助改善企業營運,使客戶能夠提供全新的 AI 服務。這些前瞻性聲明包含可能導致實質結果與預期不符之風險與不確定因素。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;我們的產品借重第三方協力廠商之製造、組合、封裝和測試之部分;技術發展和市場競爭之影響;新產品或技術之發展或我們現有產品與技術之提升;市場接受我們的產品或合作夥伴產品的程度;設計、製造或軟體的缺失;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的產品或效能降低之技術缺失;以及我們定期提交給美國證券交易委員會 (SEC) 以 Form 10-Q 報告附本為基礎的Form 10-K財務季度等其他詳細因素。NVIDIA 在公司官方網站上免費提供定期提交給 SEC 的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態,除非法律規定,否則 NVIDIA 沒有意願或義務更新或修改任何前瞻性聲明。

©本文為NVIDIA公司 2022 版權所有,並保留所有權利。NVIDIA、NVIDIA標誌、Maxine、 NVIDIA 認證系統、NVIDIA Merlin、NVIDIA Triton 與 NVIDIA Triton 推論伺服器是 NVIDIA Corporation 在美國和其他國家/地區的商標和/或註冊商標。其他公司和產品名稱可能為與之相關的各自公司之商標。功能、價格、供貨情況和規格如有變更,恕不另行通知。