深度學習的曠世巨作:GTC 以人工智慧技術為繪畫帶來革命性的變化

作者 Bea Longworth

機器也能是藝術家嗎?在今年 GPU 科技大會上有一項最美麗的展示內容,或許會讓你改觀。

在 DCGAN(deep convolutional generative adversarial networks,深度卷積生成式對抗網路)的演示內容裡,將數千件有著相似特徵的藝術畫作匯入於一部電腦內(這裡使用維多利亞時代藝術家的海景畫作),接著電腦運用深度學習技術來創作有相同風格的新畫作。如果你是某位已辭世畫家的愛好者,這是一個好消息,不過 DCGAN 的能力可不只限於畫出漂亮的畫作。

絕非只是漂亮的畫作

Facebook 研究員 Soumith Chintala 的研究成果指出,DCGAN 展現出在非監督式學習的能力,許多人認為這是追求真正人工智慧的圓夢之路。 

我們用數千件無標籤的影像來訓練深度學習系統,來演示DCGAN自主學習的能力。系統分析這些影像,找出其中的特徵,以便在不清楚這些標籤的情況下掌握風景畫和靜物畫之間的差異。

接著 DCGAN 的發展又向前邁進了一步,按照它理解畫作內不同特徵的程度,創作出它自己的原創畫作。

對於有在關注深度學習這個迅速成長的領域的人來說,這可是一個遠大的夢想。深度學習是人工智慧的一個分支,讓電腦能解決傳統編程方式難以處理的複雜問題。

深度學習的運作方式可從它的名稱略知一二:系統從經驗中學習,宛如人類的學習方式。而GPU 的平行運算架構大幅加快了深度學習的運算速度(請見《透過 GPU 加快人工智慧運算速度:嶄新的運算模型Accelerating AI with GPUs: A New Computing Model》一文)。

發現前所未知的關係

梵谷的繪畫風格細節
梵谷的繪畫風格細節

為何非監督式學習意義如此不同?因為要訓練深度學習系統得要投入海量資料才行。

監督式學習使用人類已經加上標籤的資料,而非監督式學習則是使用無標籤的資料。

假設你正在訓練一套深度學習系統來辨識貓咪的影像,使用監督式學習方式時得先在影像加上標籤,告訴系統哪些是貓、哪些又不是。

非監督式學習方式完全沒有標籤這回事。系統必須對資料進行分類,自行找出貓咪的影像。開發人員不用指示該找哪些東西,系統就能在資料裡找出蛛絲馬跡,使得非監督式學習方式擁有強大的發展潛力。

系統不會侷限在資料科學家提供的標籤裡,可以找出前人未曾預設想到的關係。非監督式深度學習系統甚至可以處理以往無法解決的問題。

改變世界

DCGAN 系統在 GTC 大會展現作畫的身手。很快地這套系統就會用來協助我們處理某些極為棘手的問題,從電腦視覺、自然語言處理到醫學診斷。由 GPU 加快運算速度的非監督式深度學習即將改變世界。