NVIDIA 的推論效能突破讓雲端到邊緣的對話式人工智慧變得更聰明、更具互動性

作者 NVIDIA

NVIDIA (輝達) 今天推出第八代人工智慧 (AI) 軟體 TensorRT 8,讓語言查詢的推論時間減半,並讓開發人員得以打造全世界最高效能的搜尋引擎、廣告建議與聊天機器人,並能從雲端到邊緣提供這些服務。

TensorRT 8 的優化只需要 1.2 毫秒就能在 BERT-Large 上達到破紀錄的語言應用速度,而 BERT-Large 是全世界最被廣泛使用的 Transformer 模型之一。企業以往只能縮小模型的大小,但也因此造成較低的精準度,如今有了 TensorRT 8,企業可以把模型的大小擴增兩倍或三倍,並大幅提升精準度。

NVIDIA 開發人員計劃事業部副總裁 Greg Estes 表示:「AI 模型正以指數級的速度變得越來越複雜,而全球各地對於使用 AI 的即時應用需求也隨之高漲。這讓企業迫切地部署最新的推論解決方案。最新版本的 TensorRT 導入全新的功能,可以讓企業把對話式 AI 應用交付給客戶,並達到過去無法企及的品質水準和反應速度。」

來自醫療照護、汽車、金融與零售業等各領域的 2.75 萬家公司、超過 35 萬名開發人員,在過去五年已經累積近 250 萬次的 TensorRT 下載量。TensorRT 的應用可以部署在超大規模資料中心、嵌入式或汽車產品平台。

最新的推論創新

除了 Transformer 的優化,TensorRT 8 還透過另外兩個關鍵功能達成 AI 推論的突破。

稀疏性 (sparsity) 是 NVIDIA Ampere 架構 GPU 中用以提升效率的新效能技術,可以讓開發人員藉由減少運算作業以加速神經網路。

量化感知訓練讓開發人員可以在不犧牲精準度的情況下,運用已訓練好的模型和 INT8 的精度運行推論,這讓他們在 Tensor 核心上進行高效率推論時,可以大幅減少運算與儲存的時間。

廣泛的業界支持

各產業的領導業者紛紛採用 TensorRT 打造對話式 AI 與各種領域的深度學習推論應用。

Hugging Face 是全球各產業的 AI 服務供應商所仰賴的開源 AI 頂尖企業,該公司與 NVIDIA 密切合作,以導入能大規模執行文字分析、神經搜尋與對話式應用的開創性 AI 服務。

Hugging Face 產品總監 Jeff Boudier 表示:「我們與 NVIDIA 密切合作,在 NVIDIA GPU 上運行最新的模型並達到最高效能。Hugging Face Accelerated Inference API 已經為透過 NVIDIA GPU 驅動的 Transformer 模型提升高達一百倍的速度。有了 TensorRT 8,Hugging Face 在 BERT 上可達到僅一毫秒的推論延遲,我們也很興奮將在今年稍晚提供這樣的高效能服務給客戶。」

提供醫療技術、診斷學及數位解決方案的創新國際企業 GE Healthcare 正使用 TensorRT 協助加速超音波的電腦視覺應用。超音波是疾病初期檢測的重要工具,此應用可以讓臨床醫師透過該公司的智慧醫療照護解決方案,提供最高品質的照護服務。

GE Healthcare 心血管超音波事業部總工程師 Erik Steen 表示:「談到超音波,臨床醫師總得耗費寶貴的時間挑選並測量影像。在 Vivid Patient Care Elevated Release 的研發前期,我們希望在 Vivid E95 超音波掃描儀上實作自動化心臟檢查,讓整個流程更有效率。心臟辨識演算法會選擇適當的影像進行心臟壁動作分析,TensorRT 具備即時的推論能力,可以提升檢測演算法的效能,同時縮短研發專案的產品上市時程。」

供應時程

TensorRT 8 已正式推出並提供 NVIDIA 開發人員計劃成員免費使用。最新版本的外掛程式、剖析器與範例,也以開源碼的方式放在 TensorRT GitHub 儲存庫供取用。

掌握 NVIDIA 最新動態

請訂閱 NVIDIA 官方部落格或追蹤 FacebookTwitterLinkedInInstagram。瀏覽 NVIDIA 相關影片及圖片,請至 YouTubeFlickr

關於 NVIDIA (輝達)

NVIDIA (輝達) 自 1999 年發明 GPU 起便成功促進 PC 電競市場的成長,並重新定義現代電腦繪圖、高效能運算與人工智慧。NVIDIA 在加速運算和人工智慧領域的開創性成就,正重塑多個市場規模高達數兆美元的產業,如交通運輸、健康醫療和製造業,亦同時促進許多其他產業的成長。欲瞭解更多資訊,請瀏覽 https://blogs.nvidia.com.tw

新聞聯絡人

NVIDIA
亞太公關總監 杜佳祐
電話:(02)6605-5856
傳真:(02)8751-1809
E-mail: Melody Tu
世紀奧美公關顧問
蔣葳/黃晨瑀/詹淑君
電話:(02) 7745-1688
分機 135/128/133
傳真:(02) 7743-9199
行動電話: 0989540634/ 0931309553/ 0975251507
E-mail: Vivian Chiang/ Bonnie Huang/ Shirley Chan

本新聞稿中的部分聲明包括但不限於有關以下內容的聲明:我們的產品與服務的優勢、影響、效能、功能和供應時程;全球各地對於使用 AI 的即時應用需求快速成長;我們與第三方公司的合作;業界領導者採用TensorRT。多項重要因素可能導致實際結果與前瞻性聲明所示之結果出現重大差異,所及範圍有全球經濟情況;我們的產品借重第三方協力廠商之製造、組合、封裝和測試之部分;技術發展和市場競爭之影響;新產品或技術之發展或我們現有產品與技術之提升;市場接受我們的產品或合作夥伴產品的程度;設計、製造或軟體的缺失;消費者偏好或需求之改變;業界標準和介面之改變;整合到系統後無法預期的產品或效能降低之技術缺失;以及我們定期提交給美國證券交易委員會 (SEC) 以 Form 10-Q 報告附本為基礎的Form 10-K財務季度等其他詳細因素。NVIDIA 在公司官方網站上免費提供定期提交給 SEC 的報告之副本。這些前瞻性聲明不保證未來的效能,只陳述目前的狀態,除非法律規定,否則 NVIDIA 沒有意願或義務更新或修改任何前瞻性聲明。

©2021 NVIDIA Corporation 版權所有。NVIDIA、NVIDIA 標誌和 TensorRT 是 NVIDIA Corporation 在美國和其他國家/地區的商標和/或註冊商標。其他公司和產品名稱可能為與之相關的各自公司之商標。功能、價格、供貨情況和規格如有變更,恕不另行通知。