BEAGLE 之眼:使用 GPU 發掘出不為人知的演進史

作者 Tonie Hansen

自然學家達爾文搭乘 HMS 小獵犬號進行環球之旅,讓他獲得物種演進過程的想法。在近乎兩百年後,另一個 BEAGLE 則是協助科學家對於複雜的基因資料突破困境,讓我們對於這世界有更多瞭解,或許還能挽救生命。

溝酸漿(或稱猴子花)

21世紀的「BEAGLE」(全名為 Broad-platform Evolutionary Analysis General Likelihood Evaluator)是一項使用 NVIDIA GPU 的開放源碼庫及應用程式介面(API)。其軟體消化資料的速度是分析 DNA 等生物序列資料的關鍵步驟,在這些生物序列資料裡有著所有生命有機體,以及許多引發 AIDS、流感及伊波拉等病毒的基因材料。

拜 BEAGLE 這個特定模型快速精準的運算能力所賜,它成為許多研究生物演進史的科學家,在軟體工作流程方面不可或缺的元素之一。從引發傳染病的細菌到研究溝酸漿花如何適應不同地理區,都是這個稱為「譜系推論」(phylogenetic inference)的領域所研究的範圍。

馬里蘭大學高級計算機研究所教授 Michael Cummings 與負責軟體設計與程式的同事 Daniel Ayres,兩人帶領開發 BEAGLE。

他們的努力使其成為 NVIDIA 2017 全球影響力大獎五名決賽入圍者之一。NVIDIA 每年頒發15萬美元給運用 NVIDIA 技術,在解決社會、人道與環境問題方面有突破性進展的研究人員。

電腦運算能力追上演化速度

Cummings 在2003年便開始有使用 GPU 來分析譜系的想法,然而當時初步提出的發展架構能力有限。隨著 NVIDIA 在2007年推出用於高性能運算的「CUDA」GPU,加上來自國家科學基金會的資助,終於誕生出 BEAGLE。

處理譜系推論裡龐大又要求繁重運算作業的資料組,進度十分緩慢,且易陷入困境。而研究人員在具備快速產生結果的能力後,便有更好的機會協助公共衛生機關來面對健康方面的威脅。

譜系關係描述多種生物物種間推斷出的演進關係。想想達爾文在探索存活於不同島嶼上多種雀鳥間關係的模樣,便可知一二。研究人員使用 BEAGLE 來掌握看似沒有關係的生物之間,是否存在著進化動力學。

伊波拉病毒

強大的表現

如今科學家藉由 BEAGLE 強大的 GPU 效能,便可使用更複雜的模型和更大型的資料組,此舉提升了推論品質,也縮短了分析時間。

Cummings 說:「BEAGLE 用以推論流感病毒與伊波拉病毒的演進史,讓科學家能夠試驗查看在哪些地區及特定時間裡出現大爆發的情況。」

BEAGLE 開放源碼庫是公用譜系分析資源 CIPRES Science Gateway 入口網站的一部分,運算基礎架構包括使用一個與 NVIDIA Tesla K20 顯示卡共存的運算叢集。

研究團隊在 CUDA 平台上的最新研究工作使用 Tesla K40 與 Quadro P5000 顯示卡,在執行新式運算法時通過大量處理核心進行高效率的平行運算作業。

疾病大爆發

部分在演化生物學裡最為廣泛使用的程式項目已採用 BEAGLE 開放源碼庫,可取得數千名科學家研究造成人類罹患 HIV、登革熱及手足口病等病症之病毒相關資料。

科學家進行的研究包括巴西經由病媒蚊傳染的登革熱病毒、奈及利亞多次爆發脊髓灰質炎病毒,以及抗藥菌在全球各地引發腸胃炎大流行。

BEAGLE 也用在動物身上,研究北美地區豬流感病毒的特徵、韓國水鳥遷徙與流感傳播間的關係,以及阿根廷吸血蝙蝠傳播狂犬病的相互作用等項目。

吸血蝙蝠

「BEAGLE 用於多方面的研究,讓我們瞭解演進方式和生物學,取得更詳盡資訊以做出決定,其角色貢獻卓越。GPU 的運算表現對於流行病學有著重大意義,用在找出迅速傳播之疾病的媒介具有哪些特徵。」Ayres 說。

Cummings 與 Ayres 現將重心放在更充分運用 NVIDIA Pascal 及下一代 Volta 處理器架構的強大運算能力,發展各項進一步提升效能的方法。來自加州大學洛杉磯分校教授 Marc Suchard 與愛丁堡大學教授 Andrew Rambaut 等科學界的助力,更是加快了 BEAGLE 的發展。

5月8-11日於矽谷舉行的 GPU 科技大會上,將宣布 NVIDIA 2017年全球影響力大獎得主。請至 GTC 報名網頁便可報名參加今年的大會。

其它入圍全球影響力大獎2017的決賽者有:印度理工學院(IIT)瓜哈提校區
一同瞭解去年全球影響力大獎冠軍的作品。

AI Podcast:深度學習聽取一度絕種的鳥類的聲音

如果你想進一步瞭解科技與生物學之間的交流情況,AI Podcast 的這集節目值得你仔細聆聽。我們邀請到 Conservation Metrics 執行長 Matthew McKown 介紹深度學習技術如何協助再次發現一度被視為滅絕的鳥類,以及有著 GPU 助力的人工智慧技術如何協助生物學家消化海量資料,以找出過去無法察覺到的發展趨勢。