消除語言隔閡:深度學習推論技術方面的突破,成為助力科大訊飛語音應用程式的基礎

作者 Jamie Beckett

從最早開播《星際爭霸戰》系列之日以來,不少人便夢想著自己也能擁有一部袖珍型即時翻譯機,還有大家一直都想「破解」醫生鬼畫符般的筆跡。

有鑒於深度學習推論方面的進步,中國最大人工智慧科技公司之一的科大訊飛(iFLYTEK)推出了實用的解決方案,將經過訓練的神經網路用於推論,學以致用。

對我說話

科大訊飛攜帶式翻譯機一如其名,是一款體積小巧的掌上型裝置,能將聽到的語音翻譯成另一種語言。

NVIDIA Tesla P4 及 P40 訓練推論加速器,加上科大飛訊科技先進的翻譯演算法,使得這具遙控器般大小的 GPU 加速裝置能即時翻譯中文、英文與維吾爾文。

科大訊飛是中國最大的語音技術提供商,該公司雲端運算研究院副院長張致江表示:「它就像是你口袋裡的專業翻譯員,隨時隨地幫你突破語言方面的障礙。」

深度學習推論效率提升 15 倍

張致江表示在使用 Tesla P4 及 P40 GPU 加速器的情況下,科大訊飛語音雲端平台的語音辨識準確率達到 97%,深度學習推論效率較 CPU 提升了15倍,這些突破為科大訊飛開拓了更多嶄新人工智慧商業應用與商業模式。

科大訊飛表示自三月份發表以來,這款攜帶式翻譯機已銷往 97 國,提供超過兩百萬次的服務。

在人工智慧的輔助下進行智慧醫護工作

科大訊飛的著眼點並不限於翻譯。這家總部位於合肥的公司正與中國多處醫院及醫療機構合作,結合本身在語音技術和人工智慧方面的長才,為醫生與患者創造出更為聰明的醫療服務。

如今已不再需要費力辨識醫生潦草的手寫病歷或處方,醫生反而能簡單地口述資訊,科大訊飛的技術便可自動將錄音內容轉成電子病歷。

科大訊飛的語音雲產品,能將醫生龍飛鳳舞般的字跡轉成易於閱讀的文字。

該公司表示部署在 Tesla P4 加速科大訊飛語音雲產品上的智慧聽寫應用產品,能篩選掉不必要的資訊,快速將醫療資料轉換為文字,中文的語音轉文字轉換準確率達 97%。

科大訊飛運用旗下的語音雲端平台來處理雲端的海量資料,並且推出多項智慧語音服務,包括訊飛輸入法、訊飛語點及靈犀語音助手。語音雲端平台有十五億名使用者,每日服務量達到四十億。

「隨著訊飛語音雲不斷升級、應用範圍不斷擴大,NVIDIA 深度學習 GPU 平台在技術層面為科大訊飛提供了相對應的發展動力,讓使用者能受益於最先進的技術,享受更美好的體驗。」張致江如此說道。

歡迎參加將於 3 月 26 – 29 日在矽谷舉辦的 GPU 科技大會,瞭解更多科大訊飛相關資訊。科大訊飛醫療執行長陶曉東將與分享該公司在人工智慧與語音辨識技術方面的研發成果,以協助醫師們進行各項工作。請立即報名