以 GPU 搭配深度學習來對抗結核病

作者 Tony Kontzer

對開發中國家的結核病患者而言,是否遇到能正確解讀胸部 X 光片的醫師,成為掌握他們生死的關鍵。數字顯示許多人原本還有機會活下去,卻因治療不當而喪命。

結核病超越 HIV/AIDS,成為舉世傳染力最強的致死疾病,世界衛生組織估算2015年有180萬人死於結核病,其中有 95% 的死亡患者居住在中低所得國家,這裡通常放射專科醫師的人數嚴重不足。

費城湯瑪士傑佛遜大學的兩名研究員企圖改變這個局面。放射學科助理教授 Paras Lakhani 與放射學科教授 Baskaran Sundaram,兩人結合自身對於胸部 X 光和深度學習的熱愛,說不定真有機會能遏止結核病的發病率。

「許多開發中國家缺乏資源來應付這些挑戰。」Lakhani 說。

深入鑽研人工智慧

幸運的是,Lakhani 兩年前決定深入鑽研深度學習,讓他激發出新的想法。他表示自己「真心著迷」於深度學習,閱讀了數百篇報告文獻後拿到一個 GPU 並打造他自己的機器。

接著他從美國國立衛生研究院、白俄羅斯結核病入口網站(Belarus Tuberculosis Portal)及湯瑪士傑佛遜大學醫院取得公開的結核病資料,以便開始測試模型。

在 NVIDIA TITAN X GPU 及 Caffe 深度學習框架、CUDA 及 cuDNN,還有 NVIDIA DIGITS 深度學習 GPU 訓練系統的輔助下,Lakhani 與 Sundaram 使用手邊的千餘件結核病圖片來訓練模型。

Lakhani 表示 GPU 模型的執行速度,比 CPU 模型在基準測試速度上,還要快上40倍。

這項成就使得開發中國家的醫療人員能夠上傳胸部 X 光、與 Lakhani 及 Sundaram 的模型進行比較,再精確地診斷異常之處。

不過在能做到這個水準之前,仍有許多難處尚待處理,像是胸部 X 光通常有 2,500 X 3,000 個像素,檔案相當龐大;加上 GPU 雖能處理這個程度的解析度,如此巨大的資料量對深度學習的模型來說,也是一大考驗。

Lakhani 表示他跟 Sundaram 不斷試驗各種解決之道,像是上傳部分比例異常部位的圖片,或是建立更深度的神經網路。

「我現在更明白如何調整這些超參數,從根本上建立更棒的模型。」Lakhani 說。

更多難題紛紛湧現

Lakhani 跟 Sundaram 兩個人還得應付更為棘手的難題:解析度縮小時,在最大的 X 光檔案裡顯而易見的細微之處,變得難以瞧出。

因此兩人致力於在解析度和資料量間取得平衡,他們的模型才能看到細微的結核病感染指標。

也就是說,Lakhani 明白這些模型的能力還是有限。

「我見過這麼多不易察覺的結核病例,還懷疑是否這麼大的模型真能羅列出所有感染指標。」他說。

Lakhani 與 Sundaram 還沒決定模型在完工後該如何運用,也沒有排除商業化的作法。

「我真的不知道該怎麼辦,才能為世人做到最完美的結果。有時候商業化是最理想的,這樣能讓眾人都使用到,而且能跟非營利組織合作。」Lakhani 說。

Lakhani 堅信的是他跟 Sundaram 合作進行的事,不會完全遏止結核病。他打算將所學用在類似的胸部 X 光相關問題上,像是胸部骨折、肺炎、肺部感染、心臟缺損及主動脈問題等。

精選圖片提供:Yale Rosen。授權方式:Creative Commons 2.0