新創公司使用人工智慧引導服務來協助視障者

作者 Scott Martin

故事要從一名視障溝通專業人士開始說起。

科技業老兵 Sujeeth 與 Suman Kanuganti 兩兄弟,想知道他們是否能利用 Google Glass 和人工智慧,為一名剛認識的視障朋友開發類似 OnStar 行車緊急情況操作員輔助的服務。

如今他們開發出用於智慧眼鏡的人工智慧引導服務「Aira」,可以幫助視障者更輕鬆地行走在街道上和執行各種日常活動。

「我們可以偵測條碼、辨識商品、閱讀產品標籤及提供語音優先體驗。」曾任 Cisco 工程師,現為 Aira 的共同創辦人暨技術長 Sujeeth Kanuganti 說。

曾任職於 Intuit 的 Suman,在聖地牙哥成立 Aira,並擔任執行長一職。Aira 為 NVIDIA Inception 虛擬加速器計畫的成員。

用於協助視障者的人工智慧

機場是最大的難關,不過想像一下,一名視障者想要通過安檢,再找到登機門才能登機。還有想要逛街和找出貨架上的商品,也不是一件多容易的事。
Aira 的創辦人把注意力放在解決這一類的日常問題上。

Aira 運用自家的人工智慧平台與智慧眼鏡,將人們與服務代理網路串連起來,以協助視障者。服務代理可以看到視障者雙眼見到的畫面,幾乎可以協助他們做任何事情。

Aira 的 Horizon Smart Glasses 搭載前向攝影機和語音功能來引導視障者,並且使用 USB 線來連接到智慧型手機,以使用手機上的 GPS、連網功能和 Aira app。
攝影機可以拍攝使用者所面對的畫面,而 Aira 的人工智慧助理 Chloe 則能幫忙辨識影像,例如雜貨店裡的一盒麥片,以及處方藥瓶上的標籤和文字。

Chloe 還能在裝置上於本機端處理簡單的事情,像是以語音引導使用者拍攝支票的畫面,再透過銀行的 app,用手機把支票存入他們的銀行帳戶。

只要點擊眼鏡上的按鈕或是 app,便可聯絡代理人,以協助使用者處理更複雜的事情。代理人透過電話直接聯絡 Aira 用戶,以語音方式提供即時視覺資訊。

獨特的人工智慧訓練方式

更為複雜的影像辨識與自然語言處理工作,則是送到 Aira 的卷積神經網路與遞歸神經網路,以便在 AWS 的 NVIDIA GPU 上進行推斷。Aira 最早使用 NVIDIA TITAN V GPU 進行訓練,現在則是使用多具 RTX 2080 Ti GPU,以開發能處理海量資料的深度神經網路。

Sujeeth Kanuganti 表示 Aira 有一套已加上標籤的優質資料。
他們自 ImageNet、Instagram 或其它公開來源取得影像,以訓練多個用於進行物體辨識的模型。Sujeeth 說使用 Aira 的服務代理完成標註的實際影像進行訓練,是再好也不過的辦法。這間新創公司已經對三百萬分鐘的服務完成標註。

「這使得它比其它技術更為精密複雜。」他說。

在 Walgreens、Wegmans 及 AT&T 的所有門市等許多地點,以及三十餘處國內和國際機場免費提供 Aira 的 Access 服務。Aira Access 合作夥伴負責提供代理指導協助服務,使用者可通過智慧眼鏡或智慧型手機上的 app 使用此服務。
在全美五十州及六個國家每天 24 小時皆可使用 Aira 的服務。

照片提供:Aira