跟我說說話:深度學習找出語音模式裡潛藏的憂鬱情況

作者 Tony Kontzer

心理治療師經常使用「談話療法」,藉由談話的方式來幫助患者克服憂鬱或焦慮。
麻省理工學院的一個研究小組使用深度學習,來揭露或許可被稱為「談話診斷」的東西,通過分析患者的口說內容來檢測是否隱藏著憂鬱症的跡象。

這項研究能以有效平價的方式,診斷嚴重的心理健康問題。

根據美國國立精神衛生研究院的資料指出,估算在美國每十五名成年人裡,就有一人有著嚴重的憂鬱症。憂鬱症會嚴重干擾我們的日常生活,但我們對它依然所知無幾。

用於辨識憂鬱症的技術,通常需要心理健康專家直接向患者提出問題,並且從答案中得出結論。

麻省理工學院研究助理、電腦科學博士生候選人,也是這項研究的首席研究員 Tuka Alhanai 表示,未來或許不一定要進行這些針對性的評估活動。她設想這個團隊的研究成果,將可用於持續監控個人的心理健康。

一切都跟資料集有關

開始使用深度學習的要訣之一,便是取得優質資料。

Alhanai 的團隊在訓練模型之際,即遇到這個難題。她特別想找一些憂鬱症患者的對話資料集。

她最終從南加州大學取得一個優質資料集。南加州大學與德國的研究人員合作,對180人的受測對象進行訪問,其中有兩成的受測者出現憂鬱症的症狀。訪問內容包括在二十分鐘裡,對受測者提出居住地點、有哪些朋友及是否感到沮喪等問題。

Alhanai 的研究結果指出其實可以在語言模式和詞彙裡發現憂鬱症,不過她想要拿掉那些引導性和預測性的問題,訓練模型來偵測一般日常對話裡的憂鬱情況,進行更深入的研究。

「資料裡有重要的蛛絲馬跡,可以提示你說話者是否患有憂鬱症。你仔細聽整段對話,掌握對話和言語裡的軌跡,還有他們所說的事物裡是否潛藏著更龐大的脈絡。」她說。

Alhanai 和她的團隊在一個使用超過四十個 NVIDIA TITAN X GPU的伺服器上進行叢集運算能力,搭配 TensorFlow、Keras 和 cuDNN 深度學習函式庫,然後開始訓練他們的模型。

他們將訪談資料集裡的片段投入伺服器叢集,拿掉與憂鬱症相關的顯著問題和參考內容,讓模型判斷其中是否存在著憂鬱症的線索。他們接著將來自健康人士和憂鬱症患者的談話片段投入模型,要求模型判斷談話內容來自何者。

在經過足夠次數的循環後,研究人員將另一段對話投入模型,要求模型判斷其中是否出現可能的憂鬱症跡象。該團隊藉由這種方式訓練了數十種模型,Alhanai 表示要是沒有 GPU,他們便做不到這一點。

成功孕育出雄心壯志

這些訓練活動使得研究團隊的模型能夠辨識一般對話裡是否出現憂鬱症的症狀,進行推論的準確率超過 70%,這個水準媲美心理健康專家的診斷水準。每項實驗都是在單個 TITAN X 上進行。

研究團隊日前出席在印度海德拉巴舉行的 Interspeech 2018 大會,透過向大會提交的一篇論文,報告了他們的研究發現,現在準備將這項成果提升到新的水平。

「這項成果讓我們倍感振奮,完成這些系統,讓它們基於評估的目的進行預測,我們還沒在臨床上使用,而是想要收集更多資料,讓系統變得更完善。」Alhanai 說。

Alhanai 當然想要使用速度更快、運算能力更強大的 GPU,她便能用更大的資料集來進行更多實驗。但是從更長期來看,她更想要探索使用深度學習來分析雙向對話的影響性,並非只是單向言語而已,如此一來就能用於診斷和因應其它心理健康狀況。

「 你可以通過語言或手勢聽到和感受到的情況,機器應該都能判斷。訊號是什麼並不重要,或許是語音、手寫筆跡、下巴的動作,也可能是肌肉繃緊的情況,我們用一種非侵入性的方式來監控這些事情。」她說。