多部廉價的 PC 能造就出熱鬧的虛擬世界,超級電腦能模擬銀河的形成,甚至是現在您手上的手機,它的功能遠勝過幾十年前當時世上最強大的電腦。
然而直到最近,要求電腦找出圖片裡的一隻鳥(這是一件連三歲小孩都會做的事情),就算最先進的電腦系統也面有難色。
這個情況將不再發生。嶄新的電腦神經網路演算法、存取龐大數量的數據資料,以及強大的 GPU 這三者整合在一起,創造出稱為「深度學習」的革命性新技術。
深入發掘
這項技術擁有無窮的發展潛力,研究人員運用深度學習技術來找出癌細胞、在瀕臨絕種的珊瑚礁裡進行珊瑚分類的工作,以及繪製出神經元之間的關係圖。
那正是深度學習技術在今年的 GPU 技術大會上成為注目焦點的原因。這場年度盛會展現了 GPU 技術如何改寫科學與產業發展,沒有其它技術像它一樣深具改變的能力。
NVIDIA 工程總監 Jonathan Cohen 表示:「深度學習技術發展的非常好,而且發生的速度飛快。人們認為無法解決或不會很快解決掉的問題,每天都一一出現答案。」
深度學習技術指教導機器按部就班查看模式、處理數據的演算法,讓電腦擁有不可思議的能力,像是辨識語音且立即翻譯成另一種語言。
比人腦更強大
這是一項重大的改變。
還只是幾年前,電腦尚做不到對人腦來說很簡單的事情。一項重要的指標:年度 ImageNet大規模視覺識別挑戰賽(ImageNet Large Scale Visual Recognition Challenge)。競賽隊伍打造系統,將上千個描述標籤裡其中一個指派到一組內有十萬個影像的集合中。2011年的參賽隊伍約有四分之一的次數誤判物體。
一年後由 Geoffrey Hinton 帶領一支來自多倫多大學的隊伍使用 GPU,將誤判率減少一半。近年來微軟研究院(Microsoft Research)將誤判率降到 5% 以下,而這已經較人腦的表現還更優秀。
深度學習技術的運作方式為何? 它從「訓練」一個人造神經網路開始,將影像、視訊和語音等許多非結構式的資料投入擁有強大運算能力的電腦。
為何稱為「深度」學習?
神經網路透過深度學習技術學習各種抽象的程度,分成簡單到複雜的內容,這就是深度學習裡「深度」的部分。每一層對某種資訊加以分類,精挑細選後再傳到下一層。
深度學習讓機器可以透過這個流程建立階級狀的表現方式,第一層可能是尋找簡單的邊緣(電腦視覺研究人員稱此為「賈柏濾波器」(Gabor filter)),次一層可能尋找形成長方形或圓形這種簡單形狀的邊緣集合,第三層可能辨識眼睛或鼻子等特徵。在五、六層後神經網路就能綜合這些特徵。結果:打造出一部能辨識臉孔的機器。
一次執行許多計算內容(或是平行執行)的 GPU 正是適合用於這個流程的裝置,將原本要耗時一年以上時間的作業縮短到只需幾週或幾天。等到使用 GPU「訓練好」系統後,科學家和研究人員就能實際運用學習內容。
這些研究過去都被視為是做不到的。語音辨識就是其中一項應用方式,即時將一種語言的語音內容翻譯成另一種語言;其它研究人員則是開發能分析社群媒體對話裡情緒的系統。
目前的研究還不夠深入,全球頂尖大學與來自 Facebook、Microsoft、Twitter、Yahoo 及多家新創公司的研究人員均致力於推動落實深度學習技術。
多位研究先進將參加 GTC 分享他們最新的研究成果。
深入瞭解:參加 GTC 獲得更多關於深度學習技術的知識
基於 GPU 這個重要的角色,GTC 成為深入學習相關知識的最佳場所。Facebook 將分享將深度學習用在物件辨識上的心得;百度、微軟及 Twitter 等業者,以及來自紐約大學、柏克萊加州大學與蒙特婁大學的專家學者亦將與會。
請參加3月17-20日於矽谷舉行的 GPU 技術大會,學習如何運用學習機器。如需更多資訊或報名,請至深度學習 GTC 網頁。