Google 與百度在上個月的 GPU 科技大會裡提出數項關於深度學習的精彩概念。
然而大會不只是推出這兩家搜尋引擎龍頭的主題演講活動。在 GTC 的新創公司高峰會「Show & Tell」(展示與介紹)活動裡,五家新創公司也展示了他們如何大膽創造出運用 GPU 的嶄新方式。
他們希望自己也像其它發光發熱的 ECS 參與者,成為偉大傳統的一部分,像是 Facebook 以20億美元收購了 Oculus,Zynga 以 $5.27 億美元收購了 Natural Motion。
就讓我們搶先一睹以下可能改變世界面貌的五項發展:
Herta Security — 位於西班牙巴塞隆納的 Herta 或許規模不大,但在人臉辨識技術圈裡可是名氣響亮。這家公司開發出全球速度最快的人臉辨識系統,在保全和行銷業這個高度競爭的環境裡,提供辨識結果給客戶。
Herta 執行長 Javier Rodriguez Saeta 在「Show & Tell」活動裡透露金球獎頒獎活動運用了該公司的技術,以找出不速之客和跟蹤者。對於想要接觸到特定目標消費者的廣告業者來說,Herta 的系統能辨識性別、概略年齡、是否有佩載眼鏡及臉部表情等參數。
觀看 Herta 的系統以十二倍速度即時掃描已錄製影片裡的人臉。就算是有化妝或戴上鬍子,也能辨識出演員的臉孔:
再次觀看 Saeta 的簡報內容。
Paracosm — Paracosm 執行長 Amir Rubin 並不要你只能靠腦袋裡的想像力,才能跟哈利.波特一起來場魁地奇球賽,他要你在自己的客廳裡就能真正打一場。
位於美國麻州的 Paracosm 使用先進手機和平板電腦裡的深度感應器,就像是 Google 那款採用 Tegra 處理器的 Project Tango 平板電腦,以取得室內空間的尺寸,並且將這些影像以 1:1 的比例繪製成真實大小 3D 立體圖。有了這些地圖,機器跟人類就能遊歷這個世界。
開發人員也能創造出嶄新的臨場感受。想像一下參觀者對博物館的導覽行程會有的反應,或對人類來說太過危險的洞穴或其它星球而由機器人探測的結果。或許某天會開發出擴增實境的遊戲,將你的客廳變成虛擬波特和其它球員上演魁地奇大戰的場地。
這是 Paracosm 在 GTC 大會展示月球漫遊車的視野畫面。再次觀看 Rubin 的簡報內容。
Jibo — 可愛的 Jibo 系列機器人是居家好幫手,它會拍照錄影;提醒行事曆裡的活動、語音留言和收到的簡訊;陪孩子讀書和玩遊戲;管理家中的自動化系統和裝置,還有進行視訊通話等。
Jibo 的身體內外部有各種你想的到的高科技,包括 Wi-Fi、立體視覺、麥克風陣列及觸覺感應器,另有先進的深度學習技術,搭配自然語言理解能力和機器學習能力,它能察覺和理解環境、做出決定,並且從經驗中加以學習。
Jibo 這個發展平台等待著各種應用程式的到來,將人類的想像力無限延伸。在這支影片裡,介紹了位於麻州劍橋市這家新創公司的吉祥物:
再次觀看 Jibo 創辦人暨首席科學家 Cynthia Breazeal 的簡報內容。
Clarifai — 未來不用再自己動手為照片加上標籤和分類,人工智慧技術會自動地,即時地幫你完成這些事。運用超威的深度學習,Clarifai 的影像辨識技術能飛快地分類數百萬張照片,改寫影像搜尋的樣貌。
這家來自紐約的新創公司最新端出即時影片分析技術。執行長 Matthew Zeiler 將一支長度三分半鐘、拍攝戶外場景的影片網址丟入 Clarifai 引擎內,十秒後掃描完所有場景、完成辨識,並且加上預測的標籤。
現在可以按照每個畫面,對整支影片和其它加入資料庫的內容進行分類。想找森林或山岳的場景嗎?或是有無白雪靄靄的山頭?只要動動手指頭就能完成。
Clarifai 的技術也能理解人類語言裡在意義上的細微差別。「jaguar」這個標籤會加在捷豹汽車及各種貓的影像上,讓你能用看的方式找出更多影像。請來體驗 Clarifai 線上演示內容。
再次觀看 Zeiler 的簡報內容。
Mirriad — 在這個輕鬆就能跳過廣告的年代裡,來自倫敦的 Mirriad 把目標放在將觀眾的目光再次回到付費廣告主的內容上。
該公司的電腦視覺技術靠著同時運行21項演算法,為客戶量身算出要在影片裡放置廣告的位置。這項技術將 2D 影片變成 3D 數據,找出攝影機移動方式、前後景的景物等因素,接著置入 3D 廣告位置,並且在場景裡進行反應,就像是拍攝時已經存在一樣。
Mirriad 的技術能置入及調整廣告,舉例來說在多個國家同時聯播某一部影集時,就能將廣告修改為當地品牌和語言。
以下為 Mirriad 的演示內容:
再次觀看 Mirriad 執行長 Mark Popkiewicz 的簡報內容。