人工智慧如何為數位單眼相機注入新生命

作者 Tony Kontzer

大多數人早已放棄操作複雜的數位單眼相機,轉而改用簡單易用的智慧型手機,不過Ryan Stout要呼籲這些人們 : 還不到時候

身兼Arsenal公司創辦人、執行長、以及研發長的Stout,帶領這家位於蒙大拿州員工僅六人的新創公司運用電腦視覺技術,開發出嶄新產品能自動調校數位單眼相機多不勝數的拍照設定。

Stout坦承他自己先前也很依賴智慧型手機。但在幾年前,他決定拿出相機開始拍夜景。從設定快門速度、光圈、以及ISO感光值,一直到選用適合的濾鏡,他很快記起攝影是一項涉及大量技術的工作。

當時他想也許很多人和他一樣都希望能簡化如此繁瑣的攝影流程。在此之前他曾創設一家公司,專門運用遞迴類神經網路(recurrent neural networks)處理自然口語訊息,這個創業經歷讓他想出一個解決方案:那就是機器學習。

跨入智慧相機時代

於是他決定運用AI打造一部嶄新類型的相機,不僅具備智慧功能,還能拍出畫質大幅超越智慧型手機的的照片,因此就著手創立Arsenal公司。

他指出,當時我想到可以利用電腦視覺近期一些發展成果,做出新產品來幫助攝影初學者拍出更好的照片。我們做的是把已經融入到手機的科技,著手整合到數位單眼相機之中。

今年稍早Arsenal在Kickstarter網站上募資時,從各界的熱烈反應就能看出大家對於簡化數位單眼相機設定的需求有多麼殷切。Stout指出,原本希望獲得5萬美元的預售目標,結果在7個小時就達成目標,收到1.6萬筆訂單共累積260萬美元銷售金額,使它成為Kickstarter網站史上最成功的相機募資產品。

(Arsenal之後在Indiegogo募資平台上以每部175美元的售價持續接受預訂)

Arsenal如何運作

Arsenal裝置其外型類似一副撲克牌,一端插入相機的熱靴座,附上的連結線再插入USB埠。使用者透過隨附的行動app來操作該裝置,從app的畫面上可看到相機的各個感測器在擷取訊號,攝影者也能透過手指移動滑桿來操控各項設定 – 全程完全不必認識快門速度、光圈、或白平衡等專業知識。

Arsenal從20萬張專業級照片累積的龐大資料集中建立其模型,從而教導裝置要拍出行家照片應該具備的關鍵要素,以及該採用哪些設定才能重現出這種大師級作品。主要的訓練程序則是動用搭載NVIDIA GeForce GTX繪圖處理器的電腦;更深度的訓練則依賴搭載Tesla GPU虛擬主機,這些虛擬主機都在亞馬遜的雲端服務公司的資料中心運行,另外還運用CUDA以及cuDNN深層類神經網路等技術執行深度學習。

完成之後,這些固定模型就會載入到裝置,所有推導作業都在裝置內直接進行,另外還會藉由韌體升級確保裝置可持續更新,讓裝置能運行最新建立的模型。

Arsenal的團隊日後會持續改進其模型,目前的工作重點在於設計出理想的軟體,使它不僅能運行app與裝置,還能因應包括品質保證(QA)、物流、以及客服支援等方面的要求。公司的目標希望在明年1月初把產品交到首批訂購客戶手中。

Stout指出,在多數大工程完成後,我們才有累積1.7萬的銷售佳績,這些幕後工作其實花費相當長的時間,最終才讓我們邁入量產階段。

從產品獲得熱烈迴響來看,這些Arsenal的早鳥買家應該不會介意等這麼久出貨。

觀看影片瞭解Arsenal如何運作