何謂聯合學習?

作者 Crowd Favorite

想成為任何醫學領域的專家,「經驗」正是其中關鍵。

知道怎麼解釋症狀、在緊急情況下該採取那一步的措施,以及提供哪一種治療方法,這一切都取決於你曾接受過的訓練與應用的機會。

人工智慧演算法的經驗來自於大量、多樣且優質的資料集,不過從前很難取得這樣的資料集,尤其是在醫療保健領域。

醫療機構不得不依賴自己的資料來源,這些資料來源可能會受到患者人口統計、使用的儀器設備或臨床專業等因素的影響,而出現偏差,或是這些機構得匯集其它機構收集的資料,以取得他們所需的各項資訊。

聯合學習(federated learning)使得人工智慧演算法可以從不同來源的大量資料中獲得經驗。

聯合學習讓多個組織可以合作開發模型,又不用彼此直接分享機密的臨床資料。

在經過多次訓練反覆運算的過程中,共用模型接觸到的資料量比任何單一組織內部擁有的資料量還要更多。

聯合學習的運作方式

在醫療情境中採用的人工智慧演算法,最終需要達到臨床等級的準確性。從廣義上來說,代表這項演算法達到或超過了它們所支援之應用程式的黃金標準。

工作十五年才能培養出某個特定醫學領域的專家,這樣的專家一年大概要看1.5萬個病例,也就是在這十五年中總共讀了22.5萬個病例。

不過講到兩千個人裡才會出現一個的罕見疾病,就算是有著三十年經驗的專家,也只會看到約一百例的特殊情況。

為了訓練出與醫學專家水準相當的模型,需要投入大量病例給人工智慧演算法,而這些病例需要充分代表將要使用它們的臨床環境。

然而目前規模最大的開放式資料集內,只有十萬則病例。

重點不只是資料量,還得具有高度多樣化,加入不同性別、年齡、人口統計學特徵和環境暴露之患者的樣本。

個別醫療機構的檔案庫內或許有著成千上萬件紀錄和圖片,只是這些資料來源通常都有採取隔離措施,主要原因在於健康資料有著隱私性,在未取得患者同意及倫理許可的情況下,便無法動用這些資料。

聯合學習則是不用把資料集中到一處,而是在分散的地方進行多次反覆運算,以訓練深度學習模型。

像是假設三間醫院決定合作開發一個自動分析腦瘤影像的模型。

如果他們選擇採用用戶端-伺服器端的主從式架構聯合方法,一台中央伺服器將用於維護完整的深度神經網路,參與的各醫院將得到一份副本,以便使用自己的資料集進行訓練。

在各客戶端對模型進行多次反覆運算訓練之後,各參與的醫院把更新後的模型送回中央伺服器,並且將資料集存放在自己的安全基礎設施中。

中央伺服器再匯總各參與醫院送回的模型,同時將更新後的參數分享給參與的醫院,以便它們能夠繼續在客戶端進行訓練。

聯合學習的中央伺服器架構。

如果其中一間醫院決定要離開訓練團隊,模型訓練事宜也不會中斷,因為它並不依賴任何特定資料。新醫院也能選擇隨時加入這項訓練活動。

這只是聯合學習的多種作法之一,而這些作法的共通點是各參與者都能投入自己資料,又獲得完整知識,可謂是各方皆贏的作法。

為何採用聯合學習?

實施聯合學習依舊要謹慎,以確保患者資料的安全無虞,不過聯合學習或許有機會解決部分需要收集機密臨床資料之方法所面臨的挑戰。

在進行聯合學習之際,臨床資料無需攜出機構的安全範圍。各參與單位都能控制自己的臨床資料。

這麼一來就變得更難拿取機密的患者資料,聯合學習倒是打開了大門,讓團隊可以建立規模更龐大多元的資料集,以訓練其人工智慧演算法。

聯合學習這種作法,也鼓勵各醫院、醫療機構與研究中心攜手建立一個加惠各方的模型。

聯合學習如何改變醫療保健領域的發展樣貌

聯合學習可以徹底改變訓練人工智慧模型的方式,其優點能夠滲入到更廣泛的醫療生態系統。

規模更龐大的醫院網路可以提供協同作業的程度,且享有跨機構取得安全資料的優點。規模較小的社區醫院與鄉村醫院則能取得專家級的人工智慧演算法。

這麼一來便能將人工智慧帶到照護現場,將來自各組織的大量多元資料納入模型開發作業,又遵守在本地管理臨床資料的要求。

臨床醫生可以按照代表了特定臨床區域更廣泛的患者人口統計特徵,或是他們在當地從未見過的罕見病例資料,取得更強大的人工智慧演算法。他們不同意輸出內容時,也能繼續訓練這些演算法。

安全透過更多元的演算法進行學習,使得醫療保健領域的新創公司能夠更快將尖端創新的服務/產品推向市場。

與此同時,研究機構能夠按照多元實體資料,而非有限的公開資料集,讓他們的研究成果更貼近實際的臨床需求。

醫療保健業者為醫療保健領域進行開發

現已展開大規模的聯合學習專案,期望能夠更快發現藥物及將人工智慧用於照護現場。

總部設於英國的藥物研發聯盟 MELLODDY,旨在證明聯合學習技術能讓製藥領域的合作夥伴享受到兩全其美的優點,也就是能夠利用全球最大的人工智慧合作藥物化合物資料集進行訓練,又不失去資料隱私。

倫敦國王學院希望自己在其倫敦醫學影像與人工智慧中心以價值為基礎的醫療保健項目中,使用聯合學習技術有助於在中風與神經功能缺分類、判斷癌症的根本原因,以及建議最佳治療方案給患者等方面,創造出突破性進展。

發掘更多關於聯合學習的資訊。