降噪、語義操作與非監督式文字建模,都只是 NVIDIA Research 團隊在過去幾個月裡不斷努力解決的一些案子。
NVIDIA 應用深度學習研究部門副總裁 Bryan Catanzaro 在最新一集的 AI Podcast 節目內,詳細介紹了該單位近期的發現成果,還分享了 NVIDIA Research 的其它研究活動。
「NVIDIA Research 的目標是找出哪些事情會改變公司的未來,然後建立原型,告訴公司該怎麼做。人工智慧便是一個很好的例子。」Catanzaro 在跟 AI Podcast 主持人 Noah Kravitz 對談時,這麼表示。
噪點!噪點!噪點!
由位於瑞士與芬蘭之 NVIDIA Research 團隊所開發的 Noise2Noise 一案發現,並非一定要使用一組相匹配的圖片來解決影像降噪的問題。
Catanzaro 說:「人們一直致力於去除影像裡的噪點,我們在開發 Noise2Noise 降噪器的過程中,覺得其實不需要使用乾淨的影像才能做到這一點。」
標準的人工智慧降噪法需要使用兩兩一對的相同影像,其中一個是乾淨的影像,另一個是充滿著噪點的影像。
在許多情況下無法取得乾淨的影像。最後還是要試著訓練神經網路使用只有充滿噪點的影像,重現出完美的影像。
「只要有同一影像或是極為相似之影像的多個不同噪點副本,便能使用這些有著噪點的影像來訓練模型,它會學習怎麼去除噪點。」Catanzaro 說。
那不過是語義
透過語義操作功能,便能更輕鬆建構出全新的虛擬世界。
Catanzaro 表示這項技術依賴於訓練有素的生成模型來建立栩栩如生的輸出內容,場景內只有高階語義描述內容。
這項技術將可發展出無止境的可能性。
訂閱收聽 AI Podcast – iTunes // SoundCloud // Stitcher // Overcast // Google Play // RSS
「它為渲染圖形和操縱圖像創造出許多新的技術,像是在編輯影像時,要是我能改變影像裡的物件類型,便可以在很多場合裡做到這一點。我可以有一支巨大的畫筆,在影像上繪製樹木。而且我在哪個地方繪製樹木,它便明白怎麼畫出適合那個地方的樹木。」Catanzaro解釋道。
語義操作技術仍處於研究原型階段,但 NVIDIA Research 團隊釋放出這項專案的源碼,發現人們有使用這項工具來建立人造衛星的影像。
人工智慧與其它專案
NVIDIA Research 的其它專案還有試著開發非監督式文字建模技術的模型,以指出某段文字內是否有著積極或消極的情緒。
Catanzaro 表示他們使用 NVIDIA DGX 系統來訓練模型,「在幾個月前發表的原始報告裡表示需要一個月的時間才能完成的事,現在我們不到一天的時間就能完成。」
Catanzaro 回顧過去,對於人工智慧的發展速度感到驚訝無比。
Catanzaro 說:「我覺得現在才剛開始。我看到很多不錯的機會,只等著人們去做,未來有很長一段時間會藉由人工智慧發展出不少有趣又有價值的事情。」
在被問到 NVIDIA 如何在正確的時間順利採用人工智慧時,他表示:
「我認為人們有時候不明白的是,NVIDIA 是通過研究來準備好迎接這項改變。」
如需更多關於我們的研究人員如何為圖形帶來革命性發展的資訊,請見下列文章或閱讀相關文章:《NVIDIA Research Brings AI to Graphics》及《NVIDIA Researchers Showcase Major Advances in Deep Learning at NIPS》。