NVIDIA 研究團隊在 NIPS 展出深度學習領域重大進展

作者 Kimberly Powell

社會大眾在心目中已經認知到人工智慧這項技術的存在,然而在全球最盛大的神經網路與機器學習大會 NIPS 裡,能夠對推動人工智慧技術向前發展的那些人們,瞭解他們到底在想些什麼。
三十年來研究員及資料科學家通過全名為「神經資訊處理系統大會」(Conference and Workshop on Neural Information Processing Systems,NIPS)這個管道,分享他們的開創性成果。不過只有在近期各界對於深度學習的興趣激增,NIPS 才真正受人注目。


座無虛席:2017年 NIPS 大會的報名人數呈一飛衝天的情況。

今年 NIPS 大會接受我們兩份報告,還另外投了兩份報告。有120餘名 NVIDIA 研究團隊的成員參與推動機器學習、電腦視覺、自動駕駛車、機器人、圖形、計算機架構、程式系統等領域的技術發展疆界。

他們雖耕耘於多個研究領域,卻有著共同目標:推動人工智慧科技領域的發展、發展新的工具和技術以引領更多開創性成果,還有將人工智慧用在當代的科技難題上,像是自動駕駛車和醫療方面。

在由 Sifei Liu 帶領研究的《Learning Affinity via Spatial Propagation Networks》這份報告裡介紹了其中一項進展。去年暑假 Sifei Liu 還是 NVIDIA 的實習生,如今已經是全職的研究科學家。

電腦視覺應用程式想要理解一張圖片的意義,需要辨識各像素呈現的內容並加上標籤,例如圖片裡的像素是屬於自行車的輪胎還是車架,還是自行車靠著的樹木。空間傳遞神經網路有訣竅正確高效率地處理這項稱為圖像分割的作業。


空間傳遞神經網路的通用架構。

深度學習神經網路採用建置完善的擴散物理原則,以深入探求相鄰像素間的關係,如此一來便有助於區分自行車輪框、輪輻和兩者間空隙的相鄰像素。這是圖像分割的空間關係,不過可以訓練神經網路判斷顏色、色澤、紋理等多項相異關係。

空間傳遞神經網路單純使用資料來學習定義和模仿這些關係,而非使用人工設計的模型,且學習模型可用於任何需要像素層標籤的作業,包括圖片去背(想想 Photoshop)、圖片上色和人臉解析等。這個模型還能找出圖片裡的功能或語義關係,人類可能還沒想到這一點。

報告內容包括神經網路運作的理論基礎及執行方面的數學證明。這套神經網路在 GPU 上運行,搭配 CUDA 平行運行程式模型,有著飛快的運算速度,較舊系統提升百倍以上。

空間傳遞神經網路無需解開線性方程或反覆推斷的作業,且高度靈活性可插入任何類型的神經網路,能夠適用於多種使用情況。

我是否能將你比喻成夏天?

 

今年 NIPS 大會的另一項重大趨勢,便是非監督式學習與生成模型的興起,而由 NVIDIA 研究員 Ming-Yu Liu(跟 Sifei 沒關係)領軍進行的《Unsupervised Image-to-Image Translation Networks》研究,便可瞧見這方面的突破性進展。

到目前為止多數深度學習作業採用監督式學習,讓機器具備真人般的物體辨識能力。舉例來說,監督式學習善於區分柯基犬與德國牧羊犬,也早就在這兩種狗兒的圖片加上標籤進行訓練。

為了讓機器擁有「想像」能力,比如想像在夏天想像冬日風景,Liu 跟他的研究團隊使用了非監督式學習和生成模型。以下便是他們的研究範例,左側冬季和夏季的風景是輸入項,右側則是人工智慧想像出的夏日和雨天景色。

NVIDIA 研究團隊使用一對生成對抗網路(GANs)搭配共享潛在空間假設,以取得這些出色成果。以上面兩張圖片為例,灰濛濛的天空、光禿禿的樹木、白雪覆地、車輛奔馳在冰凍的道路上,使用冬季景色訓練第一個 GAN,並且用一般認為的夏日景色來訓練第二個 GAN,但未使用跟對手一樣的特定景色來進行訓練。

那麼該怎麼進行?你得在同一地點對夏季和冬季的同一景色拍攝相同影片,記錄所有交通流量和其它細節。研究團隊開發出的非監督式學習系統免去了拍攝和加註標籤這些耗時耗力的工作。

共享潛在空間假設促成了這項非監督式學習系統,將部分參數綑綁在一起,為兩個 GAN 建立起關係。將第一個 GAN 裡呈現的畫面轉至第二個 GAN,讓冬季景色轉變成夏日風景。

在非監督式學習方面運用 GANs 並非什麼先例,不過 NVIDIA 研究團隊卻誕生出結果-在雲朵遮蔽部分天空的情況下,光線穿過濃密的樹葉形成陰影,這是前所未見的畫面。

這項技術潛藏著龐大優點。除了無需使用大量加上標籤的資料,也減少了建立及消化資料的時間和心力,深度學習的專家還能將這項技術用在多個領域。光是以自動駕駛車為例,可以一次取得訓練資料,並在晴朗、多雲、大雪、大雨、夜間等多種虛擬情境下進行模擬。

非監督式影像對影像轉化神經網路可用於多個領域,包括自然界的貓在內。

如需更多 NVIDIA 研究團隊在 NIPS 大會另外兩篇投稿的報告相關資料,請見《Semi-Supervised Learning for Optical Flow with Generative Adversarial Networks》及《Universal Style Transfer via Feature Transforms》。

如果本週你恰好有參加在加州長灘市舉行的 NIPS 大會,請光臨參觀 NVIDIA 研究團隊的成果:

Learning Affinity via Spatial Propagation Networks

海報展示時間:12月5日週二,6:30-10:30 p.m.,地點:Pacific Ballroom 127

Unsupervised Image-to-Image Translation Networks

焦點說明時間:12月6日週三,11:25-11:30 a.m.,地點:Hall C

海報展示時間,12月6日週三,6:30-10:30 p.m.,地點:Pacific Ballroom 120