撿拾的藝術:採用 GPU 技術的機器人贏得亞馬遜倉庫賽的冠軍

作者 Barrett Williams

來自美國、德國、日本等地的強隊齊聚一堂,訓練、較勁和證明自己是世上最厲害的隊伍。

他們不是在里約熱內盧為了四年一度的賽事而較勁,而是前往今年在德國萊比錫舉行的「Robocup 2016」活動現場,參加亞馬遜倉庫撿貨賽(Amazon Picking Challenge)。今年是第二年舉行這項賽事,考驗無人操作機器人如何找出撿貨和裝貨的方法。

這項競賽象徵將採用 GPU 技術的深度學習用在倉儲和工廠自動化作業上的風向標。在前十名的隊伍裡有五支隊伍皆採用深度學習技術,其中包括前兩名的隊伍。

Amazon Robotics 公司研究與先進發展部門經理 Joey Durham 說:「今年有許多隊伍都使用深度學習的神經網路來辨識物體,跟去年的情況有極大的不同。」

倉儲自動化的未來

Amazon 在其遍及全球的巨型倉庫裡早就使用物流機器人來搬運貨架上的物品,降低碰撞到物品的機會,這些物品接下來將運送給數百萬名顧客。不過辨識、拾取物品進行包裝、運送和裝箱,還是得靠大量的人工作業。

為了以自動化方式來進行這些工作,以及為機器人產學兩界搭起橋樑,Amazon 舉辦了亞馬遜倉庫撿貨賽,參賽隊伍得使用會自動辨識、拾撿和裝載物體的機器人,終極目標是從眾多未分類的物品中完成這些工作。

來自荷蘭的台夫特理工大學隊在撿貨和堆賽裡奪冠

來自荷蘭的台夫特理工大學(TU Delft)隊與隸屬於該校的新創公司 Delft Robotics 合作,在撿貨和裝貨兩項競賽皆獲得第一。該隊能在僅短短的150毫秒裡便偵測到物體。

TU Delft 隊使用 NVIDIA TITAN X GPU 與約兩萬幀圖片來訓練一項「基礎」模型,再據此針對「箱」和「袋」建立模型。他們使用 PyFaster-RCNN 來訓練自家的深度學習系統,而這套系統採用 Caffe 架構,並使用 NVIDIA cuDNN 進行硬體加速作業。

「在這次活動結束後,Delft Robotics 目前正努力落實獲得的 GPU 運算相關知識,並且將這些演算法用在工業系統裡。」Delft Robotics 公司電腦視覺程式設計師 Hans Gaiser 說。

德國的 UBonn Snatches 隊在裝箱賽中獲得第二名

來自德國波昂大學的 NimbRo 隊則是在裝貨賽中獲得第二名。該隊結合紅外線照射的深度預估結果與兩具 Intel RealSense SR300 深度攝影機,還利用兩具整合式 full-HD 彩色攝影機來測量稠密立體深度。

NimbRo 隊使用熱門的影像辨識基準 ImageNet challenge 進行訓練,並且為亞馬遜倉庫撿貨賽對相當少量的影像加上備註。該隊使用搭載四具 NVIDIA GeForce GTX TITAN X GPUs 的 Supermicro GPU 工作站進行訓練和記憶作業。

日本的 PFN 隊在撿貨賽中獲得第二名

來自日本的 Preferred Networks 與工業自動化鉅子發那科(FANUC)合作,在撿貨賽中獲得第二名。他們使用卷積神經網路來處理兩項相異的作業:使用 Intel RealSense SR300 攝影機產生的 RGBD 資料與 NVIDIA GeForce GTX 870M 筆記型電腦 GPU,以每幀圖片 0.1 秒的速度進行影像分割,較在 CPU 上分割每幀圖片 0.2 秒的速度更快。

Preferred Networks 部署採用 CUDA 與 cuDNN 技術的深度學習架構 Chainer,使用十萬張以 Blender 進行 3D 渲染(同樣在 GPU 的加持下)的圖片和 1,500 張人工加註的圖片,進行為期兩天的訓練。

Amazon Picking Challenge graphic