一同瞭解深度學習技術將如何促進自動駕駛車輛的發展

作者 Danny Shapiro

「Punch Buggy」、「Slug Bug」,這個碰碰車的遊戲名稱雖不一致,我們卻都玩過,幼時手中拿著一部福斯金龜玩具車跟兄弟姐妹們的車子撞來撞去。深度學習技術的運作方式如出一轍,只是多了些數學公式、身上少了些黑青。

深度學習技術是一種按部就班重整資料的演算法,用於教導機器瞭解「未經結構分類的資料」,像是影像、語音及視訊等散落在試算表和資料庫外的資料。

GPU 在這些技術了扮演著要角,3月17-20日於矽谷召開的 GPU 科技大會即為深入瞭解相關知識的絕佳機會。GTC 會中將有二十餘場介紹 GPU 如何改寫汽車產業的演講內容。

深度學習技術又是怎樣的運作方式? 透過我們最新的自動駕駛車用電腦 NVIDIA DRIVE 即能一窺其中奧秘。同時在搭載 NVIDIA Tegra 處理器的電腦視覺技術加持下,DRIVE 讓車輛擁有令人稱奇的自我認知能力。


NVIDIA DRIVE 產品可在車內顯示行車資訊與車外感應器的影像。

NVIDIA 的工程師將攝影機裝在車上,拍攝40小時的影片,以顯示 DRIVE 的能耐;接著使用 Amazon Mechanical Turk 對每個影格以人工方式一一標示,將影片裡的 68,000 個物體進行分類。

訓練人工大腦

我們的工程師再將這些影像投入搭載強大 GPU 的伺服器人工神經網路。電腦科學家稱此程序為「訓練」,讓神經網路學習查看各種模式及辨識物體。

這有點像是孩童的學習過程,父母、朋友和打鬧的兄姐教導孩童如何辨識物體,接著孩童的大腦學習如何在更多情況下辨識這些物體。

這就是應用深度學習技術裡「深度」的時機點。神經網路通過深度學習技術學習從簡單到複雜各種程度的抽象內容,各層會分類某種資訊,仔細篩選後再傳到下一層。


DRIVE 會挑出各種車輛,甚至能看到幾部車後方的警車。

深度學習技術會堆疊這些資訊層,讓機器學習電腦科學家所謂的「層次表達」內容。第一層可能會尋找邊緣,下一層可能是尋找組成角的邊緣集合,再下一層可能是尋找邊緣模式,經過多層後神經網路即學習到「正在過馬路的行人」這個概念。

GPU 正是適用於這種學習的利器,能夠將訓練神經網路的時間從原本需耗時一年減至數天。GPU 可以一次執行多項計算內容,適合搭配用於對影像等無結構性資料進行分類的神經網路。在「訓練好」系統後,就能實際應用學習內容,像是自動駕駛車輛。

精準的視覺能力

這項技術如同即時雨,低成本攝影機和感應器讓車輛可以投入海量資訊,而 NVIDIA 的先進電腦視覺技術將這些資料變成車輛導航用的 3D 地圖。

深度學習技術更是深入發揮這些技術。搭載 Tegra X1 處理器的 NVIDIA DRIVE 系統利用神經網路建立的模型,使得 NVIDIA DRIVE 能掌握人類駕駛的習性。


DRIVE 將安裝在車輛四周的感應器所投入的資料,變成自我認知能力。

如此一來 NVIDIA DRIVE 就能迅速梳理出有用資訊,像是挑出各種車輛、區分警車和計程車、分辨救護車和貨車,或是原本靜止停放又準備上路的車輛。這項能力的應用範圍不限於車輛,NVIDIA DRIVE 還能找出人行道上的自行車騎士和心不在焉的行人。

深度學習技術還能辨識出人眼無法看出的影像,像是天候不佳時 DRIVE 仍能看到閃爍的電子看板或煞車燈。

或者是辨識出福斯的金龜車。相信我們:別用 GPU 來玩「Punch Buggy」(找金龜車遊戲)。