逐一檢視細胞的特徵:運用深度學習技術努力研發治療數百種罕見疾病的藥物

作者 Isha Salian

各界為了每年對數千萬人身心造成折磨的癌症、糖尿病、心臟病等疾病,投入大量的研究心力和資金。

各地影響著四億人生命的約七千種已知罕見疾病卻無人聞問,製藥業過去一直忽視它們,藥廠無法證明開發藥物以解決少數受影響患者的成本是否合理,讓這些罕見疾病又被稱為「孤兒」疾病。

新式的融資方式與新的藥物發現方法,使得上述情況逐漸出現改變。

位於鹽湖城的 Recursion Pharmaceuticals 便將研發重點放在多個治療領域的藥物上,包括目前尚無藥可治的數百種罕見疾病,像是會破壞嬰兒大腦和脊髓內神經元,且常會致命的遺傳性 Sandhoff 疾病,這種病症在歐洲人口裡的罹病機率小於十萬分之一

Recursion 是 NVIDIA Inception 虛擬加速器計畫的一員,運用深度學習來分析生物影像。這間新創公司已經籌得逾8500萬美元的資金,期望在到2025年時能發現一百種新的治療方法。

Recursion 擁有一處實驗室,其中的機械手臂每週進行約十萬次的微型實驗,而這些實驗活動每週創造出約兩百萬個高解析度生物影像。

Nilsson 說:「一個人看不完這些影像。」

Recursion 的研究人員部署了超過百個 GPU,每週使用數 TB 的資料來訓練十餘個神經網路,並且每個月使用自家的機器學習演算法來運行高達 250TB 的資料量,以找出可望治療遺傳性出血性血管擴張症(hereditary hemorrhagic telangiectasia,一種造成血管畸形和潛在出血的遺傳性疾病)等罕見疾病的候選藥物。

Recursion 資料科學產品部門資深主管 Lina Nilsson 表示:「通常一般製藥公司只會研究一種疾病和一種假設,一次研發一種可能的藥物。我們則是發揮同步多工的精神,同時篩查數百種疾病和研究數千種藥物分子。」

巨大遠景:使用生物影像開發藥物

細胞發生病變之際,結構上看起來跟健康的細胞會有差別,所以想要判斷候選藥物是否有效的一種方法,便是將藥物加入患病的細胞內,觀察後續發生的情況。

要是罹病的細胞結構變得更接近健康細胞,代表候選藥物有望治療這種疾病。然而細胞在形態上的變化卻是極細微難辨,研究人員希望能盡快分析地更多候選藥物。

過去科學家在研發藥物時,一次只能針對一種疾病,再進行多年的研究。這種新藥研發和上市的作法,藥廠得投入逾二十億美元的成本。

「人們對生物學沒有充分的理解,這種一步一步來的龜速作法也侷限了開發藥物的腳步。我們打造的平台讓我們能夠探索多種疾病,而這是過去針對特定目標、按照順序的作法幾乎無法做到的。」Recursion 技術長 Mason Victors 說。

科學家通常會設計實驗,使用細胞顯微鏡影像來測量其中的一個或多個特徵,而各實驗的假設又數量有限。相比之下,Recursion 使用搭配 CNN 的深度學習演算法,可以在一周內分析超過千萬個細胞的數百個特徵,以及一次測試數十個假設。

Recursion 的團隊靠著大型 NVIDIA GPU 叢集進行訓練和推論。Victors表示使用 NVIDIA V100 Tensor Core GPU 與 NVLink,在多個 GPU 上進行訓練,讓他們「能將一個研究人員原本要耗費數日進行的研究進度,在訓練神經網路後,只要幾小時內便能完成。」

深度學習幫助研究人員一次查看數百種細胞特徵和疾病,以便快速著手進行新的治療領域,並且對過去未開發過的領域研究藥物。

這些工具還解釋了藥物的化合物可能會怎麼跟體內其它細胞產生相互作用,以及藥物可能有的毒性,例如損害肝臟或造成心律不整。

Recursion 的主要重點雖是放在內部藥物開發上,也能跟想要篩選大量藥物的製藥公司合作。

Recursion 已對八十餘種疾病模型進行化合物測試,FDA 已同意其中一種進行第一階段臨床試驗,目前正在進行人體臨床試驗,而 Recursion 的藥廠合作夥伴也選擇了其它多種化合物,有待進一步進行開發。