CVPR 的人工智慧狂歡盛典:NVIDIA 帶來了嶄新的 Tensor Core GPU AI 工具、Super SloMo、尖端研究成果

作者 Ian Buck

數千名全球頂尖人工智慧領域研究人員本週齊聚鹽湖城,參加電腦視覺及圖型辨識年會,NVIDIA 順勢發表了一系列工具與深度學習研究成果,期望為人工智慧領域的下一波發現提供動力。

重點議題:我們推出的開放源碼擴充項目 NVIDIA Apex,利用 NVIDIA 的 Volta Tensor Core GPU 多精度功能,協助開發團隊加快人工智慧領域的研究腳步。

在熙來攘往的展廳裡掛滿了一排排的研究海報,我們在其中也發表了十多份研究報告,包括一項能從普通影片製作出超慢動作畫面的人工智慧技術。NVIDIA 的創辦人暨執行長黃仁勳在週三晚間的一場派對活動裡,向與會嘉賓送了一份大禮,即專為人工智慧研究人員打造的限量版 Titan V GPU。

哈囉 DALI:全新工具加速推動現代人工智慧發展的引擎

 

在我們的展位裡,令人注目的焦點便是推動現代人工智慧發展的引擎,也就是 NVIDIA Volta Tensor Core GPU。

我們使用 Volta 架構重新打造了 GPU。其革命性的 Tensor Core 架構能做到多精度運算,可以在 FP16 的精度下以 125 teraflops 的浮點運算次數進行深度學習矩陣運算。在需要更大範圍、精度或數值穩定性時,提升到 FP64 和 FP32 的精度。

Searidge control windows

想要大規模優化長時間運行之程式碼的精確性和效能,確實有其難度。而有了 Apex,用戶便能更輕鬆地利用 Tensor Core GPU 內建的多精度運算功能。開發人員可以使用新推出的 PyTorch 擴充項目,按照所需的精度級別切割人工智慧的訓練量。Apex 會在可能的情況下自動視需要套用更高精度的運算方法,以及使用高效率的低精度運算方法,讓研究人員能更快訓練人工智慧模型。

NVIDIA GPU 讓運算節點以飛快的速度運行著,速度快到輸入/輸出作業都會卡關。不過 GPU 也能加快移動資料的速度,我們本週推出 DALI,解決了這個問題。DALI 是一項開放源碼函式庫,可在各大架構當成插件使用。

用戶可以通過 DALI 來定義可配置的資料處理圖形,以加快使用 GPU 訓練人工智慧時常見的影像解碼和增強步驟處理速度。我們的資料科學家最近使用這項重要技術,將資料投入搭載16顆 Volta GPU 的新款 NVIDIA DGX-2,打破過去的訓練紀錄,創下每秒鐘處理1.5萬個影像的新猷。

DALI 加上 Volta,加快將資料載入框架的速度,這個框架使用 Apex 對 Tensor Core 進行優化,Volta GPU 再以閃電般的速度訓練模型。

Searidge control windows

我們還發表了萬眾期待基於 NVIDIA GPU 的 KubernetesTensorRT 4,開發人員使用這些工具,便可將人工智慧擴展到數千個 GPU 上。我們推出基於 NVIDIA GPU 的 Kubernetes,讓開發人員能將訓練和推論的部署內容不間斷地擴大到多雲端環境的 GPU 叢集。現已推出的 TensorRT 4 可加速支援 Top-k、LSTM(長短期記憶) 及批次 GEMM(矩陣乘法) 等層級,以加快神經網路機器翻譯、推薦及語音應用的速度。

擁有尖端技術的NVIDIA Research 團隊

 

在 CVPR 可以見到研究人員展示尖端的電腦視覺研究成果。對於現有兩百餘名科學家的 NVIDIA Research 來說,是一個再自然也不過的地方。這些研究人員在此透過多項報告,解答了藝術、科學與實際應用交叉在一起的難題。其中包括:

  • 可以想像影片裡的下一個畫面嗎?我們建立了一個名為 Super SloMo 的全新人工智慧神經網路,可以聰明地填補缺失的畫面,將每秒30幀的影片轉為每秒240幀的影片。在《Super SloMo: High Quality Estimation of Multiple Intermediate Frames for Video Interpolation》這篇報告裡所描述的技術,使用標準格式的影片創造出美麗的慢動作畫面。這是電影行業的殺手級應用項目,使用標準格式的設備進行拍攝,再透過 Super SloMo,便能自由建立慢動作畫面。
  • 讓人工智慧自動為資料加上標籤該有多好?NVIDIA Research 與法國巴黎綜合理工學院、加拿大蒙特婁大學合作,為精確可靠進行手勢辨識、臉部表情辨識、臉部特徵驗證及視線追蹤建立了一套標點定位神經網路。NVIDIA 研究團隊在《Improving Landmark Localization with Semi-Supervised Learning》這篇報告裡,提出了一項用於標點定位的序列多工處理框架和非監督式學習技術(找出影像裡特定部分的精確位置,這是許多複雜視覺問題的關鍵步驟),只要標記 5% 的資料,成效便可勝過舊有的方法。
  • 要是我們只用照片就能建立新的虛擬世界,不是很酷嗎?使用條件生成對抗網路(GAN),只要拍攝城市街區的照片,就能重新建立一個新的虛擬世界。NVIDIA 的自動駕駛車研發團隊使用在《High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs》一文裡描述的方法,為 NVIDIA DRIVE 平台設計模擬測試內容。

我們在 NVIDIA SPLATNet 方面的研究成果(描述一項嶄新的深度學習架構,無需預先處理便可處理點雲),榮獲 CVPR 六大研究獎項的其中一項。

與我們一同解決世上的各項難題

 

NVIDIA 的 GPU 架構是頂尖的圖形、加速運算與人工智慧平台。結合這些,便能以令人激賞的方式點燃創新的火花。

像是 NVIDIA RTX 光線追蹤技術加上 Volta Tensor Cores 和人工智慧除噪技術,首度做到即時渲染出電影般畫質的結果。這是電影動畫、遊戲、產品設計及建築等行業夢寐以求的工具。建築師可以跟客戶以互動方式進行設計,電影動畫工作室也能即時對光線和素材進行實驗。

或是使用數十億英里的行車資料來訓練自動駕駛車,解決「安全」這道難題。得花上數年的時間在公共道路上行駛,才能收集到數十億英哩的行車資料。我們為此發明了 DRIVE Con​​stellation 與 Drive SIM 虛擬實境自動駕駛車模擬器,可以產生出多種測試條件、模擬感應器及使用神經網路來測試和反應真實行車情境。逼真的模擬內容能以更安全、更具擴展性和更具成本效益的方式,讓自動駕駛車在一般道路上行駛。

Searidge control windows

或者接受早期檢測疾病的挑戰,我們為此設計出人工智慧醫學影像超級電腦 CLARA。在過去十年間,從重建、影像處理,再到渲染,製作醫學影像需要用到大量運算資源,人工智慧應用程式數量也出現爆炸性的成長。CLARA 是一款具擴充能力的虛擬人工智慧超級電腦,可以對已安裝的舊有儀器進行升級,誕生出新一代小型智慧裝置。

人工智慧讓我們在腦海中為身邊親友現在和未來的生活,勾勒出一個更美好的世界。我們很高興參加 CVPR,表揚和歌頌發展出現有成就的人工智慧領域研究人員,一同發掘人工智慧的未來。