切膚之痛:人工智慧如何提高免疫療法的一線生機

作者 Gary Rainville

澳洲昆士蘭州坐擁充足的陽光、海水,以及綿延無盡的金色海灘,這裡卻也是全球黑色素瘤患者人數最多的地方之一。黑色素瘤是一種相對罕見卻極為嚴重的皮膚癌。

總公司位於布里斯本的新創公司,同時也是 NVIDIA Inception 計畫成員的 Max Kelsen,企圖利用人工智慧提高透過免疫療法成功治療黑色素瘤患者的機會,而免疫療法是一種配合人體免疫系統,增強身體對疾病之反應能力的治療方法。

免疫療法創造出的結果足以扭轉患者的生活,只是效果不一。一名癌症患者可能會進入緩解期,身上沒有出現任何疾病的症狀,另一名患者的免疫系統則可能會攻擊健康的器官和細胞。

在許多情況下,費用高昂且治療反應率通常不高的免疫療法,只限用於治療末期癌症。Max Kelsen 的研究團隊使用人工智慧和基因體來找出可靠的標記及開發一種測試方法,來更好地預測哪些患者在正式治療前,可以透過免疫療法來緩解症狀。

建立一項測試方法,以更佳預測治療結果

在澳大利亞聯邦政府的資助下,Max Kelsen 與 genomiQa、BGI Australia、Metro North Health and Hospital Service 及 QIMR Berghofer Medical Research Institute 合作。

各方將自己的專長用於這個案子上,Max Kelsen 使用人工智慧來挖掘大數據和探索新的見解、genomiQa 的專長為分析基因體資料、BGI 為大型基因體定序服務供應商,QIMR Berghofer 則是免疫學和癌症基因體研究的領導業者。

「這個案子要做的是基因體定序,而非單一標記,將在未來的精準醫學領域裡確立人工智慧和全基因體分析的角色。」Max Kelsen 執行長 Nicholas Therkelsen-Terry 說。

有著相關健康結果的優質資料並不多,又需要龐大的運算能力,使得推廣將人工智慧用在基因組學方面的腳步一直很緩慢。

約三千人的32億個基因體鹼基對完整序列,經壓縮後產生出相當於 30PB 的龐大資料量。另一個作法則是查看經過處理後,稱為 variant call format(VCF)的檔案,其中儲存每個人約 50MB 的資料量,同樣的三千人產生出共 150GB 的資料量。

Max Kelsen 使用兩套 IBM Power9 系統來計算這些資料,每套系統搭載六個 NVIDIA Tesla V100 Tensor Core GPU。Therkelsen-Terry 說:「在 NVIDIA 的協助下,我們處理出的資料量,足以為當前治療癌症的方式進行革新。」

Max Kelsen 使用複雜的人工智慧技術,打算整合基因體、轉錄體及患者臨床資訊,以找出分類器和開發治療反應測試法。Max Kelsen 將使用多個黑素瘤研究案的基因體資料來開發分類器,再使用於澳洲衛生體系內透過操作規程收集到的第二群四百名肺癌患者資料進行驗證和調校。

一開始的作法是半監督式學習,建立通用模型來解讀基因組的特徵。將基因體資訊構建成一種語言,便能將基因組的整個結構比擬成章節、段落、長句和短語的結構式語料庫。

Therkelsen-Terry 表示:「我們投入不少心力來開發一項技術,透過它以料想新的情境和朝著夢想前進。它學習如何在夢境裡表現現實世界,或是綜合虛假相似的情境,便能建立較現有訓練資料所提供更龐大的搜尋基礎。」

降低發病率和死亡率

Max Kelsen 及其合作夥伴花了三年的時間來解決這些問題,目標為在2019年7月前提出首篇關於 VCF 建模與黑色素瘤的報告。

他們最終著眼於確保臨床醫生能切實掌握患者治療辦法,以及最適合接受免疫治療的患者等資訊,降低黑色素瘤和肺癌的發病率和死亡率,再將這些資料用於產生出用於它類癌症的分類器。

「我們的研究範圍不只是單一腫瘤是否會對免疫療法有所反應,而是想把深度學習當成未來醫學領域的一項重要工具,讓醫療領域的專業人員使用深度學習來解決當前遇到的多項重大問題。」Therkelsen-Terry 說。