醫療人工智慧需要搭配聯合學習,各行各業未來都是如此

作者 NVIDIA

在一項多間醫院因新冠肺炎疫情所制定的計畫中顯示,任何產業中的機構只要攜手合作,都能發展出預測性的人工智慧模型,為準確性和通用性樹立了新的標準。

在今日於重量級同儕評閱醫療保健領域期刊《Nature Medicine》中所發表的內容,可以看到並肩合作展現出保護隱私的聯合學習技術,如何建立出在各組織中均能順暢運行的強大人工智慧模型,即使是在受機密或稀疏資料而綁手綁腳的產業中也是如此。

今天在《Nature Medicine》期刊上發表的研究結果表明,聯合學習打造出可以普及到各醫療機構的強大人工智慧模型,這項發現有望更進一步將聯合學習用在能源、金融服務、製造及其它領域。

該研究的第一作者 Ittai Dayan 博士說:「通常在開發人工智慧的過程中,使用 A 醫院的資料來建立演算法時,在其它醫院不見得正常使用。」Ittai Dayan 博士在 Mass General Brigham 帶領發展人工智慧,今年還成立了醫療新創公司 Rhino Health

他說:「不過使用聯合學習及其它地區客觀的多模態資料來開發我們的模型,這個模型便能普及到其它醫院,以協助世界各地第一線的醫生。」

醫療業已經有在進行其它大規模的聯合學習開發案,包括有五名研究人員在評估乳房 X 光檢查結果,以及製藥業龍頭拜耳公司正在訓練用於脾臟分割的人工智慧模型。

除了醫療保健領域,聯合學習還能幫助能源公司分析地震和井壁資料、協助金融公司改善詐欺偵測模型、協助自動駕駛車研究人員發展能夠歸納不同國家駕駛行為的人工智慧。

聯合學習:人工智慧需要一群人的付出

開發人工智慧模型的公司和研究機構通常無法順利取得各種可用資料,而飽受巧婦難為無米之炊的苦惱。這或許代表較小的組織或小眾研究領域缺乏足夠的資料來訓練一個準確的預測模型。就算是大型資料集,也可能因某一組織的患者或客戶的人口統計資料、特定的資料紀錄方法,甚至使用的科學設備的品牌而產生偏差。

大多數組織得跟同行分享資料,才能蒐集到足夠的資料來建立強大又能夠普及的模型。但在許多情況下,資料隱私法規又使得他們無法在共用的超級電腦或雲端伺服器上,直接分享患者病歷或專有資料集等資料。

這便是聯合學習可以派上用場的地方。

這項在《Nature Medicine》期刊上所發表名為 EXAM(為 EMR CXR AI Model 的縮寫)的全新研究項目,在 Mass General Brigham 與 NVIDIA 的領軍下,匯集了五大洲二十間醫院,合力訓練一個神經網路,預測出現新冠肺炎症狀的患者在到達急診科等護理點的24及72個小時之後,可能需要補充氧氣的程度。這是迄今為止規模最大、最多元的臨床聯合學習研究項目之一。

集多人之力讓人工智慧發揮作用

聯合學習讓 EXAM 研究案的合作對象能夠打造出一個人工智慧模型,從每個參與醫院所提供的胸部 X 光影像、患者的生命體征、人口統計資料及實驗室數值中學習 – 又不會看到存放在各地私用伺服器中的隱私資料。

每間醫院使用本地端的 NVIDIA GPU 來訓練同一套神經網路的副本。在訓練的過程中,每間醫院只有定期把更新後的模型權重發送到中央伺服器,全球版本的神經網路在這裡匯集更新後的模型,形成一個新的全球版本模型。

這就像是分享考試的答案,又沒有透露任何用來得到答案的學習材料。

「EXAM 研究案的結果告訴我們,可以在醫療保健領域訓練出高效能且可普及的人工智慧模型,又不用交換可以辨識個人身分的隱私資料,這麼一來便能維護資料隱私。」研究報告共同作者,且為美國國立衛生研究院介入腫瘤學中心所長、美國國立衛生研究院臨床中心介入放射科主任 Brad Wood 博士說。

「這些發現的影響力遠遠超出了這個原先用於預測新冠肺炎的跨醫院模型,也讓我們瞭解到將聯合學習用於一般領域,大有可為之處。這讓我們有了一個框架,能夠以更有效且符合規定的方式來分享大數據,如果我們想要在醫學領域發揮人工智慧深度學習的潛力,或許就得這麼做。」他接著說。

全球版本的 EXAM 模型在與所有參與機構分享資料後,人工智慧模型的平均效能提高了16%。研究人員發現與在任何單一機構訓練的模型相比,普及性平均提高了38%。

與單純使用本地端資料進行訓練的模型(藍色)相比,每間參與的醫院在使用全球版本聯合學習模型(綠色)後,人工智慧模型的效能都有所提高。本圖最初發表於《Nature Medicine》期刊。

對於擁有小型資料集的醫院來說,效能提升尤其顯著,如上圖所示。

泰國朱拉隆功大學,以及朱拉隆功國王紀念醫院醫學人工智慧中心聯合主任 Sira Sriswasdi 表示:「聯合學習使得全球各地的研究人員能夠合作朝著同一個目標前進:發展一個能夠從每個人的資料中學習且進行歸納的模型。」該醫院是合作進行 EXAM 研究案的二十間醫院之一。「有了 NVIDIA GPU 及 NVIDIA Clara 軟體,參與這項研究的過程本身並不困難,卻是產生出影響深遠的結果。」

醫療院所、新創公司從事更深入的 EXAM 研究活動

集合來自北美、南美、歐洲及亞洲等地合作單位之力,最初的 EXAM 研究活動只用了兩週的訓練時間,便能準確預測患者對氧氣的需求,這項洞察資料可以協助醫師判斷患者需要照顧的程度。

從那時起,合作單位證明這套人工智慧模型在協助建立和訓練該模型的地點以外的地方,有著不錯的普及率且表現良好。麻州的另外三間醫院 – Cooley Dickinson 醫院、Martha’s Vineyard 醫院及 Nantucket Cottage 醫院,也都對 EXAM 進行了測試,發現使用各院獨立未公開的資料,這套神經網路也有著優秀的表現。

Cooley Dickinson 醫院發現這套模型預測了患者到達急診室後24小時內對呼吸器的需求,靈敏度為 95%,特異性超過 88%。英國劍橋的 Addenbrookes 醫院也發現了類似的結果。

開發原始模型的 MGH & BWH 臨床資料科學中心的科學主任 Quanzheng Li 博士說,Mass General Brigham 打算在不久的將來部署 EXAM。Mass General Brigham 的醫療網路除了與 Lahey 醫院與醫療中心,以及英國的 NIHR 劍橋生物醫學研究中心合作,還跟 NVIDIA Inception 計畫成員新創公司 Rhino Health 合作,使用 EXAM 進行前瞻性研究。

使用先前新冠肺炎患者的病歷對初版 EXAM 模型進行回顧性訓練,研究人員已經掌握有關患者最終需要多少氧氣量的真實資料。這項前瞻性研究將人工智慧模型用於新入院患者的資料,朝著在真實世界環境中進行部署的目標又邁出了一步。

劍橋大學醫學院放射學系主任 Fiona Gilbert 說:「聯合學習具有改變的力量,可以將人工智慧創新帶入臨床工作流程。我們與 EXAM 持續合作,目的在於讓這類全球性的合作活動可以重複進行且更有效率,這樣便能滿足臨床醫生在處理棘手的健康問題,顧及日後出現傳染病疫情的需求。

NVIDIA NGC 軟體中心開放下載研究用途的 EXAM 模型。企業與研究機構可以使用 NVIDIA AI Enterprise 的人工智慧工具和框架軟體套件,該套件經過最佳化調整,可在 NVIDIA 認證系統上,以便更熟悉操作聯合學習。

這篇論文更深入介紹了聯合學習背後的科學原理,並且請閱讀我們的白皮書,當中介紹了使用 NVIDIA Clara AI 平台進行聯合學習的相關資訊。

請訂閱 NVIDIA 醫療照護領域最新動態,還有在 Twitter 上追蹤 NVIDIA Healthcare