見微知著:數百種罕見疾病透過深度學習發現治療藥物

作者 Isha Salian

癌症,糖尿病,心臟病。這些疾病無疑地吸引了大量研究工作和資金,原因就是:它們每年折磨著數千萬人。

但是,大約有 7,000 種已知的罕見疾病 很少引起關注。這些疾病也被稱為“孤兒”疾病,影響到全球大約 4 億 個個案,一直以來更被製藥業所忽視,因為無法證明為解決少數患病患者而開發藥物的費用是合理的。

由於有了新的 集資方式 和新的藥物發現方法,這種情況正在慢慢改變。

位於鹽湖城的 Recursion Pharmaceuticals 專注於跨多個治療領域的藥物發現,包括數百種目前缺乏治療的罕見疾病,例如 Sandhoff ,它是一種遺傳性且致命性的疾病,破壞了嬰兒大腦和脊髓的神經元。在歐洲,這種疾病的患病率不到十萬分之一

作為 NVIDIA Inception 新創虛擬加速器計劃 的成員, Recursion 正在使用深度學習來分析生物圖像。這家新創公司已經募集了超過 8500 萬美元的創投資金,目標是在 2025 年前發現 100 種新療法。

Recursion 擁有一個實驗室,該實驗室每周用機械手臂進行約 100,000 次微型實驗。這些實驗室的實驗每周可創造出大概 200 萬張高解析度的生物圖像。

尼爾森說:“一個人不可能看到所有這些。”

它的研究人員部署了一百多個 GPU ,每週訓練數十個 TB 的神經網路。該公司每個月通過其機器學習演算法運行 250 TB 的數據,以針對遺傳性出血性毛細血管擴張症 ( Hereditary Hemorrhagic Telangiectasia, HHT 一種因為基因缺陷導致血管畸形和潛在出血的遺傳性疾病)等罕見疾病有希望的候選藥物。

Recursion 資料科學產品資深總監 Lina Nilsson 表示:“通常,公司會同時研究一種疾病和一種假設,一次研究一種潛在藥物。” “我們正在進行多重處理,一次篩選數百種不同的疾病,數千種藥物分子。”

真正的目標:具有生物圖像的藥物發現

當細胞生病時,它的結構看起來與健康細胞不同。因此,確定候選藥物是否有效的一種方法是將化合物添加到生病的細胞中並觀察會發生什麼變化。

如果細胞結構發生變化,使其更接近健康細胞,則候選藥物是有希望的。但是,對細胞的這些形態變化可能很難檢測到,研究人員希望盡快分析盡可能多的候選藥物。

在傳統的藥物發現過程中,科學家一次只能專注於一種疾病,且要研究多年。採用這種方法,發現一種新藥並將其推向市場可能要花費超過 20 億美元

這家新創公司的技術長梅森·維克多( Mason Victors )說:“傳統藥發現的方式是一種非常循序漸進的方法,由於世界對生物學的了解有限,過程緩慢且艱辛。” “我們在這裡建立的平台使我們能夠探查許多疾病,以往循序漸進,目標驅動的方法難望項背。

科學家通常設計實驗來測量細胞顯微圖像中的一個或幾個特徵,並在每個實驗中測試有限數量的假設。相比之下,通過使用 CNN 的深度學習演算法, Recursion 可以在一周內分析超過 1000 萬個單元中的數百個特徵,並一次測試數十種假設。

該團隊依靠大量的 NVIDIA GPU 進行訓練和推論。 Victors 說,使用 NVIDIA V100 Tensor Core GPU 和 NVLink進行的多 GPU 訓練讓他們“加速一個網路的研究人員從花了幾天時間訓練,到數小時內完成訓練。”

深度學習可幫助研究人員一次查看數百種細胞特徵和疾病,從而使他們能夠快速地尋求新的治療領域,並查看以前未開發領域中的藥物化合物。

這些工具還揭示了一種藥物化合物可能如何與體內其他細胞相互作用,以及它可能具有什麼潛在毒性,例如損害肝臟或引起心律不整。

雖然 Recursion 主要專注於內部藥物開發,但它也與想要篩選大量化合物的製藥公司合作。

該公司的產品線包括針對 80 多種疾病模型進行測試的化合物。一種化合物已獲 FDA 批准 用於 1 期臨床試驗,目前正在人體中進行臨床測試,而 Recursion 的藥物合作夥伴已選擇了幾種其他化合物進行進一步開發。