這裡、那裡,無處不在:會自我學習的人工智慧將改變物流業的發展樣貌

作者 Tony Kontzer

一直以來困擾著物流業的難題之一,便是找出最短的行車配送路線。

1930年代首次提出的「旅行推銷員問題」,試圖推斷串連一組城市的最短路線,以確保善用時間和資源。

來自倫敦之人工智慧新創公司 InstaDeep 的共同創辦人暨執行長 Karim Beguir,本週在 GPU 科技大會對與會者表示,有著 GPU 助力的深度學習與強化學習技術,或許能解開這個謎團。

過去採用優化解算器、啟發式演算法及蒙地卡羅樹搜尋演算法等方式,試圖解決旅行推銷員問題。Beguir 指出這些方法卻有著共同的缺點:它們不會學習。

Beguir說:「它們沒有從過去解決的問題裡汲取經驗,藉由種種計算而解開了這個問題,如果能從中有所收獲,也是一件好事。」

然而 Beguir 表示近期的研究工作,結合運用深度學習神經網路的速度與蒙地卡羅樹搜尋演算法經過深思熟慮再提出的決策,將有望帶來突破而改變物流業的發展面貌。

他以 DeepMind 建立的 AlphaZero 計畫為例進行說明,這項計畫將神經網路、蒙地卡羅樹搜尋演算法,還有自我學習能力結合起來,打造出他所謂的「新一類的人工智慧冠軍」。

為打敗世上最佳圍棋、將棋及西洋棋手而開發出的 AlphaZero,顯然具有更深一層的意義。

「一切是從什麼資料都沒有的情況下展開的,系統跟自己對奕產生出唯一的資料結果。」Beguir 說。

AlphaZero 串連了 Daniel Kahneman 在其著作《快思慢想》(Thinking, Fast and Slow)中所描述的兩個認知過程,一個就是掌握我們大部分生活裡的快速和直觀反應,另一個則是用於深思熟慮,以解決更複雜的問題。

InstaDeep 受到這項進步的啟發,致力於將蒙地卡羅樹搜尋演算法注入深度學習,將 AlphaZero 般的能力用於解決商業問題。該公司在 NVIDIA DGX-1 人工智慧超級電腦上運行模型,有望出現部分重大發展結果。

InstaDeep 的人工智慧演算法無需進行訓練,而是從頭開始逐步找出解決旅行推銷員問題的更好辦法。這項演算法還會學習如何更有效率地進行裝箱,解決物流業的另一個難題。

Beguir 雖然覺得開發會從經驗裡進行學習的人工智慧,是解決物流業等行業裡頭痛問題的好方法,他也說會自我學習的人工智慧技術要成為一項成熟的商業解決方案之前,還有一段路要走。

「這只是先對解題一事小試牛刀,我們期望能在這方面看到更多的發展。未來要是你的系統不會自我學習,或許是裡面出了點什麼狀況。」Beguir 說。

InstaDeep 為 NVIDIA Inception 計畫成員之一,該計畫協助加快新創公司推動人工智慧與資料科學領域的發展腳步。