破紀錄在 53 分鐘內完成 BERT 模型訓練並大幅縮短推論時間至 2 毫秒,協助 Microsoft 等客戶將頂尖語言理解技術導入超大規模應用
NVIDIA (輝達) 今日宣布在語言理解領域獲得多項突破,讓企業透過即時對話式 AI 能更自然地與顧客互動。
NVIDIA 的 AI 平台率先訓練當今最先進的 AI 語言模型之一 BERT (Bidirectional Encoder Representations from Transformers),用不到一小時就完成訓練,並在 2 毫秒內完成 AI 推論。突破性的效能協助開發者將頂尖語言理解技術導入在各種提供給全球數百萬消費者的超大規模應用。
率先採納 NVIDIA 先進效能成果的業者包括 Microsoft 與許多全球最具創新力的新創公司,透過 NVIDIA 平台著手為其客戶開發能即時反應的高度直覺化語言服務。
雖然有限度的對話式 AI 服務已存在多年,然而發展至今,包括聊天機器人、智慧個人助理與搜尋引擎等服務想要以人類理解力的水準運作仍極為困難,主要原因是無法即時部署超大規模的 AI 模型。NVIDIA 透過在其 AI 平台導入多項關鍵的優化技術藉以解決這項問題,不僅在 AI 訓練與推論方面刷新速度紀錄,同時也建構出至今最大的語言模型。
NVIDIA 深度學習應用研究部門副總裁 Bryan Catanzaro 表示:「超大語言模型徹底顛覆自然語言 AI。因為它解決許多極為困難的語意問題,往真正的對話式 AI 邁進一步。NVIDIA 的突破性成果除了加快這些模型,還讓組織建構新型頂尖服務,以未曾想像的方式協助與滿足客戶。」
最快訓練、最快推論與最大模型
以自然語言理解技術運行的AI服務預計在未來幾年呈現指數成長。根據 Juniper Research 的報告,光是數位語音助理市場規模預計在未來 5 年內將從 25 億美元成長到 80 億美元。此外, Gartner 也預測 2021 年,15% 的客服互動將完全由 AI 執行,與 2017 年相比增加 400%。1
NVIDIA 力助邁入新時代,藉由多項關鍵優化微調其 AI 平台,創下三項新的自然語言理解效能紀錄:
- 最快訓練:採用內建由 1,472 個 NVIDIA V100 GPU 組成 92 個 NVIDIA DGX-2HTM 系統的 NVIDIA DGX SuperPOD™,執行全球最先進的 AI 語言模型之一 BERT 的大型版本,成功把 BERT-Large 的訓練時間從先前的數日大幅縮短至僅 53 分鐘。此外,NVIDIA 也能透過僅一台 NVIDIA DGX-2 系統在 2.8 天內就完成 BERT-Large 的訓練,展現 NVIDIA GPU 在對話式 AI 領域的擴充性。
- 最快推論:NVIDIA 以 NVIDIA T4 GPU 運行 NVIDIA TensorRT™,在 BERT-Base SQuAD 資料集上僅用 2.2 毫秒就完成推論,不僅遠低於許多即時應用要求的 10 毫秒的處理門檻,也大幅領先以高度優化 CPU 程式碼執行的 40 毫秒。
- 最大模型:針對開發者對於更大模型永無止境的需求,NVIDIA Research 在 Transformers 的基礎上著手建構與訓練全球最大的語言模型,並導入 BERT 採用的技術元件,以及許多其他自然語言的 AI 模型。NVIDIA 的客製化模型擁有 83 億個參數,數量足足比 BERT-Large 多出 24 倍。
產業生態系的廣泛支持
全球數百名開發者正運用 NVIDIA AI 平台推動語言理解的研究並開發新服務。
Microsoft Bing 正運用其 Azure AI 平台與 NVIDIA 技術執行 BERT,藉以獲得更精準的研究成果。
Microsoft Bing 小組計畫經理 Rangan Majumder 表示:「Microsoft Bing 仰賴最先進的 AI 模型與運算平台,為顧客提供最好的全球搜尋體驗。我們與 NVIDIA 緊密合作,透過 Azure AI 內建的 NVIDIA GPU,針對熱門的自然語言模型 BERT 進一步優化推論作業,在排名搜尋品質方面,獲得從去年部署以來最大幅度的改善。在 Azure 環境中執行推論,NVIDIA GPU 相比 CPU平台在延遲縮短幅度超過 2 倍,吞吐量更提高 5 倍,讓 Bing 為全球顧客提供更具相關性、低成本與即時的搜尋體驗。」
多家參與 NVIDIA Inception 計畫的新創公司包括 Clinc、Passage AI 與 Recordsure,也正運用 NVIDIA AI 平台為包括銀行、汽車製造商、零售商、醫療機構、旅遊住宿等業者提供頂尖對話式 AI 服務。
Clinc 透過 NVIDIA GPU 建構多款對話式 AI 解決方案,提供給全球超過 3,000 萬名客戶,其中包括頂尖車廠、醫療機構與全球領導金融機構包括 Barclays、USAA、以及土耳其最大銀行 Isbank。
Clinc 執行長 Jason Mars 表示:「Clinc 頂尖 AI 平台能瞭解複雜的問題並將其轉化為有利的情資,提供給全球頂尖品牌進行行銷。NVIDIA AI 平台的突破性效能讓我們突破對話式 AI 的疆界,提供各種革命性服務,協助顧客運用科技,以更有意義的有效方式和顧客進行互動。」
優化方案即日釋出
NVIDIA 即日起將用來達成對話式 AI 突破成就的軟體優化方案全面釋出給開發者:
- NVIDIA GitHub BERT 模型的訓練程式碼與 PyTorch 學習框架*
- NGC 模型 Scripts 與 TensorFlow 的 check-points
- GitHub 上針對 TensorRT 優化的 BERT 範例
- Faster Transformer: C++ 語言 API、TensorRT 外掛與 TensorFlow OP
- MXNet Gluon-NLP 包含 AMP 對 BERT 的支援方案(訓練與推論)
- AI Hub 上針對 TensorRT 優化的 BERT Jupyter 軟體說明註記
- Megatron-LM:用來訓練超大型 Transformer 模型的 PyTorch 程式碼。
*NVIDIA BERT建置方案是熱門 Hugging Face repo 程式庫的優化版本
更多資訊
- NVIDIA 影片: 對話式 AI 的下一步
- NVIDIA 開發者部落格:運用 TensorRT 訓練 BERT 模型發展即時自然語言理解系統
- NVIDIA 深度學習應用部落格:MegatronLM: 運用 GPU 模型平行處理技術訓練數十億參數語言模型
掌握 NVIDIA 最新動態
請訂閱 NVIDIA 官方部落格或追蹤 Facebook、Twitter、LinkedIn 與 Instagram。瀏覽 NVIDIA 相關影片及圖片,請至 YouTube 或 Flickr。
關於 NVIDIA (輝達)
NVIDIA (輝達)自 1999 年發明 GPU 起,成功促進PC電競市場的成長並重新定義現代電腦顯示卡產品,掀起電腦平行運算革命。近年來 GPU 深度學習也促發被視為下一個運算時代的人工智慧,透過GPU以類人腦方式運作於電腦、機器人與自駕車等,來感知並解讀真實世界。欲瞭解更多資訊,請瀏覽 https://nvidianews.nvidia.com/。
新聞聯絡人
NVIDIA 亞太資深公關經理 杜佳祐 電話:(02)6605-5856 傳真:(02)8751-1809 E-mail: metu@nvidia.com |
世紀奧美公關顧問 黃晨瑀/林欣怡/詹淑君 電話:(02) 2577-2100 分機 826/817/807 傳真:(02) 2577-1600 行動電話: 0931-309553/ 0916-788690/ 0975-251507 E-mail: BonnieCY.Huang@eraogilvy.com AndreaHI.Lin@eraogilvy.com ShirleySC.Chan@eraogilvy.com |
本新聞稿中的部分陳述內容,包括但不限於以下內容:NVIDIA 在語言理解領域獲得多項突破讓企業能透過即時對話式 AI 更自然地與顧客互動;NVIDIA 技術與 NVIDIA AI 平台和 BERT 的效能、影響與效益;NVIDIA AI 平台協助開發者將頂尖語言理解技術導入在各種提供給全球消費者的超大規模應用;率先採納 NVIDIA 平台著手為客戶開發能即時反應的高度直覺化語言服務;NVIDIA 在 AI 訓練與推論刷新速度紀錄並建構出至今最大的語言模型;超大語言模型徹底顛覆自然語言 AI協助解決許多極為困難的語意問題,往真正的對話式 AI 邁進一步;NVIDIA 的突破性成果加快模型並建構新型服務,以未曾想像的方式協助與滿足客戶;自然語言理解技術運行的 AI 服務預計在未來幾年將呈指數成長;數位語音助理市場與由 AI 執行的客服互動將預計成長;全球數百名開發者正運用 NVIDIA AI 平台推動語言理解的研究並開發新服務;Microsoft Bing 透過 NVIDIA 執行 BERT 並促進更精準的搜尋結果;NVIDIA 與 Microsoft 合作優化 Bing 與其效益、影響與效能;新創公司透過 NVIDIA AI 平台打造頂尖 AI 服務;NVIDIA AI 平台使 Clinc 拓展對話式 AI 的疆界並以提供革命性服務,以創新的方式協助並與客戶進行互動,以及 NVIDIA 針對 BERT 優化的程式碼,這些前瞻性聲明包含可能導致實質結果與預期不符之風險與不確定因素。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;我們的產品借重第三方協力廠商之製造、組合、封裝和測試之部分;技術發展和市場競爭之影響;新產品或技術之發展或我們現有產品與技術之提升;市場接受我們的產品或合作夥伴產品的程度;設計、製造或軟體的缺失;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的產品或效能降低之技術缺失;以及我們定期提交給美國證券交易委員會(SEC)之 Form 10-K 年報與 Form 10-K 季報中詳列的其它因素。NVIDIA 在公司官方網站上免費提供定期提交給 SEC 的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態,除非法律規定,否則 NVIDIA 沒有意願或義務更新或修改任何前瞻性聲明。
©本文為 NVIDIA 公司 2019 版權所有並保留所有權利。NVIDIA、NVIDIA 標誌、NVIDIA DGX、NVIDIA DGX SuperPOD 與 TensorRT 是 NVIDIA 公司在美國及其它國家商標及(或)註冊商標。所有其他公司及產品名稱乃為所屬個別公司之商標。功能、定價、出貨時程和規格之變更不會另行通知。