超越《星際爭霸戰》的 VISOR:搭載 GPU 的視覺輔助裝置如何讓盲人能「看見」

作者 Tonie Hansen

編輯手札:此為介紹 NVIDIA 2017 全球影響力大獎五名決賽入圍者系列文章之一。NVIDIA 將頒發15萬美元給運用 NVIDIA 技術,在解決社會、人道與環境問題方面有突破性進展的研究人員。

牛津大學研究團隊所提出的開創性電腦視覺和義肢假體技術,讓離真正開發出《星際爭霸戰》科幻作品裡出現另一項充滿未來感裝置的程度,又更近了一大步。


《銀河飛龍》影集裡
Geordi La Forge 戴著 VISOR

在這部科幻作品裡,一名視障角色戴著包覆雙眼讓他能「看到」的 VISOR 裝置。牛津大學教授 Philip Torr、他的同事 Stephen Hicks 及研究團隊協助弱視者達到類似效果,有可能改變他們跟四周環境互動的方式。

世界衛生組織指出全球有 2.85 億名視障者,在生活方面深受影響。

牛津大學研究團隊的「visor」採用先進電腦視覺技術,運用 GPU 來處理攝影機拍攝到使用者四周環境的影像,接著對這些影像進行視覺化處理,透過他們開發出的眼鏡鏡片就能看見。

這項研究讓這群研究員成為 NVIDIA 2017 全球影響力大獎五名決賽入圍者之一。NVIDIA 每年頒發15萬美元給運用 NVIDIA 技術,在解決社會、人道與環境問題方面有突破性進展的研究人員。

建立視覺地圖

視力正常者用雙眼掃描空間等新環境,簡直易如反掌。人類雙眼會直覺記錄邊界、注意主要物體和形成視覺地圖,接著再注意微小的細節。

視障者的雙眼無法取得環境資訊,極難以建立視覺地圖,使得他們無法獨立和享受自由。

「電腦視覺讓視障者有更多參與日常生活環境的機會。」孩提時著迷於機器人和人工智慧的 Torr 說。然而此舉需要極高的運算能力,也遭遇到不少困難。

製作成功的視覺假體裝置,關鍵之一便是讓使用者快速辨識和定出遇到之物體的相關位置,也就是建立視覺地圖,這需要大量的運算能力來優化特定環境裡發現的大量參數。牛津大學的研究團隊將重點放在高效率平行處理資料上,以執行這項訓練。

帶領使用 NVIDIA TITAN X 進行電腦視覺研究活動的 Torr 說:「GPU 是我們的主力。GPU 架構和平行處理能力是電腦視覺研究活動的重心,我們使用 CUDA 架構,對開發者的支援讓我們能進行繁重的編碼作業。」

視障者使用的 OxSight Helios 智慧眼鏡。

智慧眼鏡

將電腦視覺技術併入視覺假體,也是一大難題。

使用者要在日常環境裡佩戴頭戴式裝置或眼鏡,視覺假體裝置必須要便於攜帶且輕盈,且即時執行複雜的演算法。NVIDIA Tegra GPU 在團隊的原型裝置裡提供大部分的運算能力。

牛津大學的 Hicks 團隊其研究重點放在視覺義肢技術上,開發出視障者使用的智慧眼鏡。日前在英國各地對300名登記有案的視障者進行眼鏡試戴活動,其結果對某些人的生活發生了改變。三成的參與者發現自己的視物能力立即出現大幅改善的情況。請見 Hick 的 Ted talk 演講影片(請點擊這裡)。

測試活動如此成功,去年獨立出的 Oxsight Ltd. 公司便打算將其商品化,而研究團隊如今在思考怎麼加入人工智慧技術。

這包括打造個人專屬的眼鏡,戴上眼鏡後便會從使用者四周環境建立資訊,協助眼鏡學習辨識日常物品。

58-11日於矽谷舉行的 GPU 科技大會上,將宣布 NVIDIA 2017年全球影響力大獎得主。請至 GTC 報名網頁便可報名參加今年的大會。

其他2017年全球影響力大獎決賽的入圍者有:

印度理工學院(IIT)瓜哈提校區

馬里蘭大學高級計算機研究所

梅奧醫院

請見去年全球影響力大獎得主的作品。