GPU 如何協助找出日常生活用品中的毒素

作者 Tonie Hansen

編輯手扎:此篇文章是介紹 NVIDIA 2015年全球影響力大獎 五位入圍者的系列文章之一。該項大獎針對採用NVIDIA技術進行開創新工作;為社會、人道主義及環境問題提出解決之道的研究人員,提供高達15萬美元的獎金。

早餐麥片。嬰兒洗髮精。止咳糖漿。洗碗機洗滌劑。

這份購物清單也是一份會致病的產品列表。事實上,如果這些產品在超市上架前未經過徹底的檢驗,它們會讓你病得非常嚴重。

有些產品包含多種化學化合物,人們每天都會暴露在其中,而這些物質可能是有毒的。有毒物質來自各個地方,包括環境汙染、化妝品及清潔劑成分、藥品、食物添加劑及殺蟲劑等,族繁不及備載。

在某個商品被拿下貨架;丟進購物車之前,為了檢驗包裝標籤上列出的內容物,得先耗費數個月的時間。隨著每天都有新產品進入市場,藥廠、食品業者及零售商不再依賴費力的測試來評估數千種化學物質的數據。他們仰仗研究人員使用 GPU 來協助評斷何者有害,何者無害。

大數據,需搭配龐大的運算能力

奧地利約翰開普勒林茲大學的 生物資訊研究所 (Institute Bioinformatics) ,是第一個成功運用 深度網路 (deep network) 進行毒性預測的機構。

這樣的成果讓該機構得已入選為 NVIDIA 2015年全球影響力大獎 的五位入圍者之一。此項大獎每年皆頒發15萬美元予利用 NVIDIA 技術進行開創性工作;為社會、人道主義及環境問題提出解決之道的研究人員。

研究人員發現,此種方法的龐大運算負荷,唯有 GPU 才能扛得起。

「高通量 (high-throughput) 生物技術提供給我們數據,而且是大數據,但是我們要如何破解這些數據?現在,我們已擁有可以處理這些數據的硬體設備,」此機構負責人Sepp Hochreiter博士說,「我們利用運算型 GPU 及標準繪圖卡來開啟神經網路,我們得以獲得龐大的運算能力。」

他表示,「對於政府機構或大型製藥公司而言,使用生物方法測試化學毒性及預期外的副作用是不可行的。」使用生物方法意謂測試期極長,以及需進行活體測試。Hochreiter指出,「採用運算模型讓事情變得簡單多了。」

Tesla GPU負責計算深層網路數值

深層網路 (Deep network) 是一種人工神經網路,它的特性就是大量的階層及隱藏的編碼單元。為了要利用深層網路來處理毒性預測數據集,此機構採用四張NVIDIA Tesla K40 專業顯卡,這是 Tesla加速運算平台的一部分,這個平台由 GPU加速器及支援軟體組成。

這些 GPU 都安裝在一台 Dell R920伺服器內,這台伺服器具有四顆 octacore CPU及512GB的主記憶體。用來在 Tesla K40 GPU 上訓練深層網路的程式是以 CUDA 撰寫。

圖說:科學家檢視化學結構的片段,找出可指明反應中心 (reactive  center) 的模式。之後根據這些結果來進行分子的分類。
圖說:科學家檢視化學結構的片段,
找出可指明反應中心 (reactive center)
的模式。之後根據這些結果來進行分子的分類。

「一開始我們是採用小型的電腦繪圖卡,就是大家用來玩遊戲的那種。但是後來我們有了 Tesla K40 專業顯卡,它的記憶體容量非常龐大,所以我們可以把數據存在專業顯卡上,」 Thomas Unterthiner表示,他在這個機構裡進行這項研究,同時在攻讀他的博士學位,「神經網路在 GPU 上運作— CPU 幾乎沒做什麼事。是GPU 負責了所有的數值計算 (number crunching)。」

現在,使用強大的計算模型,可以更快且更容易地透過中斷基於化學結構的特定生物路徑,以預測某物質是否有毒性。這有助於科學家能夠更正確地決定何種化學物質需進一步測試。

此機構的成就之一是毒物預測的高準確率,這讓它在一月贏得 Tox21數據挑戰(Tox21 Data Challenge) ,這個活動是由美國國家環境健康科學研究院、美國環境保護局和美國食品和藥物管理局共同舉辦。

 NVIDIA 全球影響力大獎 的更多訊息