NYU 成為 GPU 卓越研究中心的生力軍,引領深度學習領域超越極限

作者 Chandra Cheij

紐約客總愛說:”來聊聊吧。”

然而,在現今科技進步的時代,溝通這檔事已經大幅被電腦所主宰。無論是語言辨識、影像辨識,以及語言翻譯等,幾乎都可藉電腦之力完成。

紐約大學 (NYU, New York University) 的數據科學研究中心 (Center for Data Science),是附屬於紐約大學的一所研究機構,專門研究這些曾經難解的深度學習(deep learning) 課題,並讓這些新技術逐漸成為主流。該中心憑藉著數據科學的兩門利器來達成這些目標:也就是機器學習,以及平行與分散式系統。這兩項利器讓各種應用程式得以處理龐大的資料量,並且輕鬆容易而極具效率。


Yann LeCun是NYU數據科學研究中心 (Center of Data Science) 的發起人。

Yann LeCun是NYU數據科學研究中心
(Center of Data Science) 的發起人。

Yann LeCun是該中心的發起人,同時也是Facebook的AI Research人工智慧部門主管,可說是深度學習領域的先驅。NVIDIA公司一向致力於先進GPU深度學習科技發展,平行運算研究以及教育等等方面,因此,該中心與NVIDIA擁有非常緊密的同盟關係。

 

我們之間共同的努力,讓NVIDIA決定將該中心列為本公司GPU卓越研究中心 (GPU Center of Excellence) 的一員。

 LeCun 表示,“能夠加入我們許多同儕研究機構,並列為GPU卓越研究中心的一員,讓我們感到相當振奮,也感謝NVIDIA公司的協助。我們必定能夠繼續在深度學習領域上持續突破,並且培育新世代的資料科學研究人員。”

突破研究瓶頸

當資料量越來越多,演算法越來越複雜,一台機器上僅能容納有限的運算量以及記憶體,使得科學研究人員面臨許多技術上的瓶頸。

要將深度神經網絡研究發展到極致,必須尋求方式,突破單一機器的侷限性。於是,GPU上場的時刻到了。與NYU資訊資料科學研究中心的合作當中,我們將會著重在可擴充的學習演算法,以及分散式的訓練系統等兩個方面。

這些演算法和系統能夠幫助電腦”學習”,足以辨識並且確認那些以往只有人類可以做到的事情。GPU幫助電腦節省時間,訓練深度神經網絡,讓電腦在更短時間內學會確認圖形和物體,同時也使用更少的基礎資料。

與NYU資訊資料科學研究中心的合作當中,我們也會開發新的深度神經網絡架構,使用分散式訓練系統中的可擴充記憶體以及運算資源來進行。目前,至少有四個相關的共同研究計畫,在進行大型深度學習計畫的艱難挑戰。

合作計畫與機會

NVIDIA與該中心的合作目標,是為了讓習慣於使用CUDA技術的科學家們,啟動資料分析的科學及研究。CUDA乃平行運算程式設計模型,用於增進GPU加速系統的運算效能。

我們亦將致力於精進Torch平台,此平台最初是由NYU開發的機器學習工具,已有模組可提供深度神經網絡開發,以及優化機器學習時使用。Torch將因為演算法的改善以及分散式訓練系統的精進而更加強大,讓研究人員可以在深度學習的領域上超越極限。

身為當今世上23間GPU卓越研究中心的其中一員,NYU資訊資料科學研究中心將可使用NVIDIA提供的各項資源,包括支持研究暨學術計畫所提供的設備及獎助金等等。研究人員已經佈建了NVIDIA GPU硬體及軟體工具組,並將之使用於NYU數學學院(NYU Courant Institute of Mathematical Sciences),以及資訊資料科學研究中心所提供的課程之中。

未來,仍有其他的大型機器學習合作機會正在規劃,譬如深度學習的黑客松/駭客馬拉松(hackathon)系列活動,或是機器學習計畫的夏季學程等等。