在顯微鏡下放大檢視:頂尖病理學實驗室融合資料來源,開發癌症檢測人工智慧技術

作者 Crowd Favorite

哈佛醫學院與布萊根婦女醫院的研究人員在 GTC DC 大會介紹他們利用基因組及健康紀錄資料,以提高診斷癌症的準確性。

最近的一項研究指出,病理學家在使用活體組織切片樣本來診斷乳癌之際,只有四分之三的場合會對結果表示同意。

分析組織切片的過程既麻煩又耗時,使得病理學成為醫院中最花錢的科別之一。

哈佛醫學院與布萊根婦女醫院病理學助理教授 Faisal Mahmood 所領軍一支團隊,開發出多項深度學習工具,結合多項資料來源,像是數位全視野切片組織病理學資料、分子資訊和基因組學,以協助病理學家及提升診斷癌症的準確性。

擔任布萊根婦女醫院計算病理學部門同名 Mahmood 實驗室負責人的 Mahmood,本週在 GPU 技術大會華盛頓特區場次之 GTC DC 大會的演講中向外界介紹這項研究成果

他在日前的一次採訪中表示,病理學家對於診斷所抱持的各種看法,「說不定會造成可怕的後果,由於對診斷結果抱持著懷疑,就得進行更多的活體切片檢查和不必要的介入手術。深度學習或許能協助診斷及預測患者對治療的反應,而減少主觀偏見的情況。」

病理學家根據癌症類型和自身的經驗水準,可能要十五分鐘或更長時間來分析活體組織切片。要是一個病人就有幾十個切片,就要花更多時間來分析。

在決定治療方案時,醫生還會考慮其它資料來源,比如患者和家族病史,以及可用的分子和基因組資料。

Mahmood 的研究團隊在醫院內部及雲端環境中使用 NVIDIA GPU 來開發人工智慧工具,整合各項資料來源以分析病理影像。

「我們的演算法加入全視野切片影像及融合多模式資料來源,愈來愈貼近實際臨床工作流程。如此一來就能使用人工智慧輔助病理學診斷工具,搭配多模式資料進行前瞻性研究。」Mahmood 說。

人工智慧看見完整樣貌

在組織活體切片檢查的過程中,要拍攝大量且檔案尺寸極大的數位化全視野切片影像,每張的尺寸超過 100,000乘100,000像素。為了以高效率的方式來計算這麼大的檔案,深度學習的開發人員經常選擇將切片分割成單獨區塊,讓神經網路更容易著手處理,但是這種作法使得研究人員要花上大量時間,以人工方式對訓練資料一一加上標籤。

Mahmood 實驗室開發出一種深度學習模型,利用 NVIDIA GPU 加快訓練神經網路及推論的速度,以一種高效率運用資料的方式一次解析整個組織切片。這些模型可用於對患者進行挑選及分層,以給予更精準的治療。

該團隊靠著醫院內部四架搭載 NVIDIA GPU 叢集的伺服器,製作其深度學習模型的原型及進行推論。研究人員另外使用 Google Cloud 中的 NVIDIA V100 Tensor Core GPU,投入大尺寸病理學影像來訓練影像卷積神經網路及對比預測編碼模型。

Mahmood 實驗室的研究員 Max Lu 說:「現代的 GPU 讓我們能夠使用全視野切片來訓練深度學習模型。優點是無需調整當前病理學家分析全視野切片與準備報告的臨床工作流程。」

加入資料來源

病理學家通常使用組織切片、免疫組織化學染色標記和基因組圖譜等大量資料來進行判斷,只是當前多數的深度學習診斷方法,都是靠著單一資料來源或融合多項資訊的作法。

這倒是讓 Mahmood 實驗室的研究人員決定要用一種更具啟發性和整體性的方式,發展結合顯微鏡和基因組資料的機制。初步研究結果指出加入基因組圖譜和圖形卷積神經網路的資訊,有助於提升診斷和預後模型的準確性。

融入病理工作流程

Mahmood 發現兩種將深度學習納入病理學家工作流程的潛在方法。經過人工智慧加入註釋的切片影像,可以當成輔助病理學家的第二意見,以提高診斷品質和一致性。

或是使用計算病理學工具篩選出所有陰性病例,如此一來病理學家只要查看可能是陽性的組織活體切片即可,大幅減輕了工作量。過去就曾這麼做過:醫院在1990年代開始使用第三方業者的子宮頸抹片掃描和分層服務,以排除各項陰性病例。

Mahmood 說:「假設有四萬個乳癌組織切片,其中兩萬個是陰性,那麼有一半會被剔掉,病理學家便不會看到這些切片。光是減少病理學家的工作量,就會減少意見分歧的情況。」

研究人員打算使用 Dana Farber 癌症研究中心的組織活體切片資料進行回顧性和前瞻性研究,以測試和驗證其演算法。他們將研究病理學家在看到演算法的判斷後,是否會改變自己對組織活體切片的分析結果,以及使用人工智慧是否會減少對診斷意見的分歧。

Mahmood 實驗室的研究人員將在十二月舉行之 NeurIPS 大會的 ML4H 研討會上,介紹其深度學習研究項目。

本文主圖為皮膚角質棘皮瘤(keratocanthoma)的全視野切片影像。圖片由 Alex Brollo 提供,取得Wikimedia Commons CC BY-SA 3.0使用授權。