解密生成式人工智慧革命的BeGAN開端

大幅加速創作工作流程的生成式人工智慧應用程式將掀起一波熱潮,而 NVIDIA 研究團隊的 GauGAN 技術展示就是起點。
作者 Gerardo Delgado

編者按:本文為「解碼 AI 」系列文章,以簡單易懂的方式解密人工智慧,並介紹 RTX PC 的新硬體、軟體、工具與加速功能。

生成式模型徹底改變人工智慧領域,尤其是 ChatGPT 和 Stable Diffusion 等熱門應用程式。

基礎人工智慧模型與生成對抗網路 (GAN) 為這股熱潮鋪路,讓生產力與創造力大幅提升。

驅動 NVIDIA Canvas 應用程式的 NVIDIA GauGAN 模型運用人工智慧技術,將草圖轉化為擬真藝術作品。

BeGAN歷程

生成對抗網路 (GAN) 為深度學習模型,內含兩個互補型神經網路:產生器與判別器,

兩者是對立關係。產生器負責建立逼真寫實的影像,判別器則負責分辨影像真偽。由於兩者的神經網路相互對抗,生成對抗網路 (GAN) 產生的樣本就會越加真實。

生成對抗網路 (GAN) 擅長理解複雜的資料模式,創造高品質結果,適合應用於影像合成、風格轉移、資料增強和影像轉譯。

NVIDIA 人工智慧技術展示應用程式 GauGAN 以後印象派畫家高更命名,專門用於產生擬真影像;由 NVIDIA 研究團隊打造,直接催生 NVIDIA Canvas 應用程式;使用者可透過 NVIDIA AI Playground免費體驗 NVIDIA Canvas。

GauGAN 於 2019 年 NVIDIA GTC 首度亮相後便受到廣大歡迎,使用者包括藝術老師、創意組織、博物館,而且有數百萬人已在線上使用過此技術。

將草稿轉化為優美風景,創造大師級作品

NVIDIA Canvas 採用 GauGAN 技術與本機 NVIDIA RTX GPU,運用人工智慧技術將簡單的筆觸化為逼真的風景,並能即時顯示結果。

使用者可先以現實世界元素 (例如草地或雲朵,在應用程式中稱為「素材」)  為底,再描繪簡單的形狀與線條。

接著,人工智慧模型會即時產生強化版影像,顯示在畫面的另一邊;例如,使用「山」素材繪製多個三角形後,即會產生絕美的擬真山脈;使用者也可選擇「雲」素材,只要按幾下滑鼠,就能將畫面從大晴天變成滿天烏雲。

創意有無限可能,只要畫出池塘,水池就會倒映影像中的樹木與岩石等元素;將素材從白雪變為草地,場景就會從冬季美景變成熱帶天堂。

Canvas 提供九種風格,各有 10 種變化形式與 20 種素材可選擇。

Canvas 的全景模式可讓藝術家創作 360 度影像,在 3D 應用程式中運用。YouTuber Greenskull AI 示範以全景模式繪製一個海灣,並匯入 Unreal Engine 5。

下載 NVIDIA Canvas 應用程式,立即開始使用。

不妨一併探索 NVIDIA Broadcast,另一個採用人工智慧技術的內容創作應用程式,可將任何家中任何空間變成居家錄音室。RTX GPU 使用者可免費觀看直播。

生成式人工智慧正在改變遊戲、視訊會議與互動式體驗。訂閱 「解碼 AI」電子報,瞭解最新消息與未來趨勢。