搭配人工智慧技術的影像辨識引擎通常用於在大堆頭圖片裡進行分類,像是建立狗狗的圖片資料庫,或是在團體照裡找出朋友的臉孔。
不過偶爾進行分類的目標是找出不想要的圖片,像是在購物網站上找出贗品。
那正是來自巴塞隆納之人工智慧新創公司 Restb.ai,為西班牙人氣爆棚的二手品行動市集 Wallapop 所做的事。
人工智慧篩選出的黑名單
Restb 剛開始跟 Wallapop 合作時,並未想到是要做挑出贗品的事情。創辦人暨執行長 Angel Esteban 向 Wallapop 推銷自家公司能將使用者上傳的商品進行分類,以提供更佳的瀏覽體驗。
不過他跟 Restb 團隊發現一個更大的問題:Wallapop 未能跟上嘗試販售假藥、維他命或食品等商品之使用者的腳步,這是執法單位所不容許的,也會讓 Wallapop 惹上大麻煩。
因此 Restb 著手開發一項電腦視覺演算法,自動執行 Wallapop 篩選商品的流程,以挑出違反網站規定的內容。Restb 在開發「黑名單」分類器的過程中,得克服三大難題:
- 得達到某個具體性,讓分類器能區分出外觀極為相似的商品,像是白色鈕扣和藥丸
- 得達到至少 99% 的準確性,將 Wallapop 的潛在曝險降至最低
- 得能分析使用者從各種角度及各種照明條件下產生的圖片
「靠著資料庫的『基本』影像辨識方法,無法應付這些難題,得用上機器學習電腦視覺技術。」Esteban 說。
Restb 從為可能的產品,以及照片裡可能出現的各種形態、背景和環境建立一套鉅細靡遺資料集開始,推動該公司的神經網路達到最高的精確度,以開發根本的深度學習模型。
GPU 扮演著要角
Restb 是 NVIDIA Inception 人工智慧新創公司計畫的優選合作夥伴,在其作品裡大量採用多款 Tesla、TITAN X 及 GeForce GPU。GPU 使得 Restb 能快速在其神經網路上重複執行各項作業,將從過去費時數月的訓練實驗活動縮短到數日,或是將過去需要數日完成的實驗縮短到數小時便可完成。Restb 也使用 CUDA 及 cuDNN 來輔助開發深度學習模型。
Restb 的解決方案還走向雲端,因此達到預定的精確度和速度,需要用到唯有 GPU 能提供的龐大運算能力及平行運算能力。證明:Estaban 表示 Wallapop 的使用者上傳圖片時,Restb 開發出的 API 會在不到半秒鐘的時間內驗證圖片,此時 Wallapop 會自動拒絕或接受商品。
擴大電腦視覺的應用範圍
Restb 為 Wallapop 開發出的作品也擴大其應用範圍,以解決更困難的問題:讓電腦瞭解它們在看的東西是什麼,像是協助不動產業自動辨識有著挑高天花板或充足自然光的房間。
「主要尚待開發的領域之一,便是秉持電腦視覺不只能用於物體辨識,還能用在理解上概念想法。人類很容易就進行這類分類工作,但你想想看,要跟機器解釋自然光這個非具體的概念,又不是那麼簡單。」Esteban 說。
Esteban 表示增進視覺解讀能力可能會為醫療領域帶來革命性的變化,在部分醫療人力短缺的國家裡,有著成堆的體檢結果有待檢視。多數診斷結果雖是陰性,但積壓的情況會造成因拖延病症而變成陽性。
他說人工智慧電腦視覺能夠篩選出所有陰性結果,留下無法判別或陽性檢驗內容,再交由專業醫療人士來解讀。
Esteban 指出不動產等多個產業有著尚待解讀內容的爆量圖片,Restb 的技術能協助他們增進搜尋引擎的優化結果、篩選出不要的圖片及大幅增進使用者的應用心得。
Esteban 說:「電腦視覺的商業應用將會是無遠弗屆。」