機器學習為何?拜 GPU 加速器所賜,你的生活已和它緊密相關

作者 Sumit Gupta

Adobe、百度、Netflix、Yandex,在社群媒體及雲端運算產業中,這些全球最知名的企業都是採用基於 NVIDIA CUDA 架構的 GPU 加速器來執行一種被稱為先進機器學習的技術,用以提供看似神奇的搜尋、智慧性的影像分析,以及個人化的電影欣賞推薦。

就如同它的名稱聽起來那般,機器學習就是透過資料的篩選分類,來訓練教育電腦本身,例如,透過分析許多狗、雪貂、豺狼、浣熊和其他動物,以及包括狐狸在內的的影像,來學習辨識出狐狸。這一切就如同人們的學習一樣。

這是一項功能強大的工具,然而機器學習演算法卻可能得動用到擁有數千顆 CPU 的伺服器,才有辦法檢視數量大得驚人的資料,那樣的作法太昂貴了,不切實際且不可行。但是,這卻是非常適合交給 Tesla GPU 加速器來處理的工作。它們是 GPU 晶片的加強版本,原本是用來協助遊戲玩家炸開成群的數位外星人,現在則是被廣泛用於快速且高效率地處理各種視覺運算問題。

加速 Adobe 影像分析

假如你的工作內容和影像或影片相關,則你每天都會使用到 Adobe 軟體。Adobe Creative Cloud 的使用者累積至今已超過 180 萬名,他們從世界各地以虛擬方式使用相關工具,包括 GPU 加速的應用程式,例如 Premiere ProAfter Effects,以及 Photoshop。現在 Adobe 的研發團隊藉由使用 CUDA GPU,來協助建立更深層次的學習影像處理工具,進而促使 Creative Cloud 能做得更多。

machinelearninginsideuse

深層學習或許是一個艱深詞彙,但是未來的 Adobe 工具將可以使用這種技術驅動創新的可能性,舉例而言,或許能夠從影像中自動辨識出特別的字型,來協助使用者為他們自己的創作專案選擇正確的字型。它們甚至可以在一份作品中,協助使用者辨識影像的情緒與風格,藉此協助使用者快速找到更多傳達類似情緒或獨特審美觀的影像。

Adobe 公司的數位影像工程部處長 David Howe 表示:「我們朝向 Creative Cloud 的發展,為整個 Adobe 公司開展創新的新紀元。GPU 加速的機器學習功能開啟了一扇大門,讓我們能使用令人興奮的新特性與能力,這一切將可加速創意發想過程,並讓你的作品脫穎而出。」

Netflix、百度、Yandex

全世界的其他網路服務公司也採用了類似的步驟:

  • Netflix 正在實地測試由 GPU 訓練的神經網路所產生的影片推薦內容,藉此分析其 4,000 萬名串流服務訂閱用戶的電影觀看型態。其目標在於:更準確地辨識出訂閱用戶會喜歡的新電影,並隨著時間推移而改善其影片推薦內容。
  • 百度是中國最大的搜尋引擎與網路服務公司,它是最早,也是最積極佈局深層學習技術產品的公司之一。它的產品範圍包括語音識別與翻譯、OCR (光學字元識別)、臉部與物體識別、以內容為主的影像檢索,以及線上廣告最佳化。百度已使用 NVIDIA GPU 來訓練他們那擁有龐大數據的巨大深層神經網路,可大幅提升使用者體驗。
  • Yandex 是俄羅斯最受歡迎的搜尋引擎,首開先例在製作過程中廣泛採用 NVIDIA Tesla GPU,藉以改善網站搜尋排名的品質。利用 GPU 加速器,Yandex 能夠讓訓練排名模型的速度較 CPU 快上 20 倍,進而能為 Yandex 每月高達 8,100 萬名的使用者提供關聯性為高的搜尋結果。