萬名資料科學家在 Data Science Bowl 活動裡齊力對抗肺癌

作者 Jamie Beckett

肺癌在所有類型的癌症裡是致死率最高者,原因不只是它最常出現變異的情況。

美國肺臟協會指出近八成的患者在確診後的五年內就會死亡,大部分的因素是多數患者等到末期時才發覺身體不對勁。

Data Science Bowl 是人工智慧領域最具企圖心的一項競賽,北京清華大學的兩名研究員使用深度學習及 GPU 提出一項演算法,或許能及早檢查出肺癌並進行治療,以解救患者的生命。他們面臨的挑戰是使用機器學習來提高電腦斷層(CT)掃描的準確度,CT 在檢查肺癌方面比 X 光更有效。

Liao Fangzhou 與 Zhe Li 兩位研究員擊敗萬人組成的近兩千支隊伍,獲得由顧問公司 Booz Allen Hamilton 及 Kaggle 資料科學社群主辦、NVIDIA 等企業贊助的第三屆 Data Science Bowl 活動冠軍頭銜及 50 萬美元獎金。

冠軍隊伍將揭露致勝策略

5 月 8-11 日於矽谷舉行的 GPU 科技大會裡,各冠軍隊伍將介紹他們的致勝策略,並分得由 Laura and John Arnold 基金會提供的百萬美元總獎金,這是活動史上獎金最高的一屆。

第二、三名的隊伍將各獲得二十及十萬美元,剩餘的獎金由第四到第十名的隊伍均分。

清華大學計算神經科學博士生 Liao Fangzhou 決定參賽來自他個人的想法。他的家鄉空氣污染十分嚴重,而在他就讀的中學旁就有一座煙霧瀰漫的工廠,肺癌是很常見的疾病,。比賽開始不久,他得知他的一個朋友也罹患肺癌。

這支隊伍使用 NVIDIA TITAN X GPUs 來訓練其卷積神經網路。

其它的優勝隊伍分別是:

  • 第二名:來自荷蘭的軟體和機器學習工程師 Julian de Wit 與 Daniel Hammack。de Wit 曾獲得2016年 Data Science Bowl 活動的第三名,在個人部落格的文章裡介紹他於肺癌篩檢挑戰裡所扮演的角色。
  • 第三名:以兩名成員所任職的一家荷蘭公司而命名的 Team Aidence,使用 Tesla K80 GPU 加速器來開發演算法,第三名成員則任職於舊金山的非營利組織 Open AI

「這屆的 Data Science Bowl 展現了集眾人智慧的強大能力,且資料科學和先進的分析技術可用於來解決根除癌症這類社會所面臨的難題。」Booz Allen 資深副總裁 Josh Sullivan 表示。

需求:精確的 CT 肺癌掃描結果

相較於只是拍一張照片的常規 X 光檢測法,可詳細呈現身體橫截面的低劑量 CT 掃描更能檢測出癌症。根據一項美國國家癌症研究所近期進行的實驗指出,比起接受 X 光檢測癌症者,接受低劑量 CT 掃描的患者,其死亡風險要降低上 15-20%。

可惜的是據一項發表於《內科醫學年鑒》(Annals of Internal Medicine)的研究報告指出,多達三分之一的 CT 掃描結果在患者沒有肺癌時檢測出肺癌,給病患及其家人造成了不必要的恐慌,也產生了不必要的檢查和其它程序。

「減少低劑量 CT 掃描的偽陽性率是提高肺癌 CT 篩檢準確性,且對大眾健康產生正面影響的關鍵步驟。」國家癌症研究所項目主任 Keyvan Farahani 說。Farahani 為出席即將召開之 GTC 會議的演講嘉賓之一,對競賽設計和資料集提供科學指導。

在今年的 Data Science Bowl 裡參賽者的登錄時間約為 15 萬個小時,提出近 18000 個演算法。

如需更多人工智慧運算技術如何改寫醫療及其它產業的發展樣貌相關資訊,請參加 5 月 8-11 日於矽谷舉行之 GTC 活動。