深度學習協助機器人學習人類的行走方式

作者 Jamie Beckett

機器人 Darwin 行走時身體仍會搖搖晃晃,有時候還會跌倒,但它跟大多數機器人不一樣,它會從錯誤中學習(這點跟人類很像),飛快地調整技術。

它的踉蹌學步導致新一代自動機器人的產生,不需要人類重新設定程式,它可以適應變動的環境和新的情境。這些機器人能進行救援或清理受災區等危險作業,或者成為家務或包裹遞送小幫手。

帶領 Darwin 研究計劃的加州大學柏克萊分校博士後研究員 Igor Mordatch 表示:「自動機器人能接受更高程度的目標,找出完成的方法。那將會是一股極為強大的力量。」

機器人的學習方式

Darwin 從兩個 GPU 加速深度學習網路取得它所需要的知識,深度學習技術透過多層模擬神經網路,利用模仿人腦的演算法進行「學習」。這些神經網路的學習方式跟人類一樣,強化或弱化神經元之間的鏈結以回應反饋內容。

Darwin 的學習分為兩個階段:在模擬和在實際環境裡。當成學習基礎的 Mordatch 創造出模擬機器人 Darwin 實體(長度、周長等)的模型,還有指定部分基本環境特徵(像是地毯或粗糙地形)。

就是沒教機器人怎麼走路。

在模擬環境裡,機器人利用已獲得的知識來找出動作的正確順序,像是如何將腿擺放到定位以走到特定位置,或是如何扭動身軀以便從傾斜的姿勢立直身子。

在無人教導的情況下,機器人運用深度學習技術從地板上站起來。
在無人教導的情況下,機器人運用深度學習技術從地板上站起來。

迅速學習

在第二階段裡,Darwin 把在模擬環境裡習得的內容用在實際環境裡。這裡情況就變得有點複雜,Darwin 得立即判斷在崎嶇地面上保持平衡,或是扭動腳踝過多的時候就會跌倒,得重新再站起來一次。

Mordatch 說:「就算我們盡量逼真模擬真實環境,兩者還是有所差異,而那正是我們需要迅速讓機器人進行學習的原因。」

要學習如此複雜的內容,得借重 GPU 的力量。

「如果我們透過 CPU 來訓練機器人,需要一週的時間;但使用 GPU 的話,只要三小時就好了。」Mordatch 說,他使用託管在 Amazon 雲端環境裡的 GPU 來進行訓練。

深度學習技術及大腦

Mordatch 服務於加州大學柏克萊分校機器人技術助理教授 Pieter Abbeel 的實驗室,在 Mordatch 繼續進行 Darwin 研究案的同時,也將深度學習技術用於建立人體模型。他跟來自史丹福大學的研究人員組成團隊,研究人腦如何創造出動作。

這項知識總有一天能夠讓醫界進一步預測部分手術會如何影響到病患的行動。