擊敗黑天鵝:朝向持續性端對端的 GPU 運算及視覺化技術發展

作者 Bill Maimone

無論出現英國脫歐這類出人意料的政治事件,或是劇烈天候等這些影響著商業決策的因素,順應「黑天鵝」事件(指極不可能發生,實際上卻又發生的事件)進行調整的能力,成為區別貴企業只是泛泛之輩或是佼佼者的關鍵。

深度學習對企業來說是一項革新性的發展,但通常只是一個逐步實施的過程。準備資料常得花費數週時間、主成分分析又要跑個幾小時,用個機器學習更得用上數天或數週的時間,並不適合用於應付那些瞬即生變的意外事件。

那個情況已經開始出現轉變。軟體元件跟硬體結合出的綜合效應,與分析及深度學習一同出現演進,將深度學習變成一項持續性、互動性的使用體驗。

在近期一篇部落格文章(請見《End-to-end Analytics on the GPU Data Frame》一文)裡,MapD 執行長暨創辦人 Todd Mostak 說明分析、機器學習及深度學習的領域裡,GPU 軟體堆疊正在出現變革。

NVIDIA 在硬體方面的創新技術提供百倍以上的處理核心和20倍大的記憶體頻寬,使得 MapDContinuumH2O.ai 等企業能重新撰寫關鍵元件,以利用技術方面的嶄新發展局面。

Todd 還介紹了上個月成立的 GPU 開放分析計劃(GPU Open Analytics Initiative,GOAI),旨於推動在 GPU 內無縫整合任何 GPUI 啟動的元件及採用 Apache Arrow 等開放源碼元件,以促進免費開放的合作方式。

五月時在 GPU 科技大會初次展現的GOAI 原型整合項目,將原本在 CPU 上需半日時間進行處理的作業,在價格上相當的 NVIDIA GPU 硬體進行處理,時間縮減到只要90秒便可完成。

這為概念驗證成果打響了第一砲,然而後續發展才更令人關切:

  • 在這場首次進行的演示活動裡,在單一伺服器上進行所有作業,部分階段是只靠單顆 GPU 執行。GOAI 在2017年的目標之一,便是看到為多 GPU、多節點啟用的所有零件能配合端對端水平擴充,以迎合任何大型、複雜的使用個案之需求。MapD 以其 0 release 加入多節點水平擴充,預計今年與所有元件相匹配,包括在所有零件間進行重大資料移轉。
  • 機器語言處理這個最耗費運算資源的階段,將大幅增進其執行速度。NVIDIA 在 GTC 2017 發表 Volta 架構,其中新增了專為機器學習使用的矩陣代數所設計的640個 Tensor Cores,將執行效能提升12倍。
  • GOAI 加入了 BlazingDBGraphistry 及 UC Davis Gunrock 這些新成員,且通過治理流程以接納更多成員和採用者。

這項演進的下一步便是將深度學習當成一個互動性、持續性的過程,更像是人類思考的過程。

若貴公司是在賓州西部做生意,或許未曾考慮過劇烈天候中斷公司運作的可能性,不過近期對於該地區罕見地發出龍捲風警報,代表五金行的生意變好了或是旅遊業者得吃土了。旅館的住房率會上升還是下降?

迅速進行調整的方法之後,便是在曾受過相似天災襲擊的地區裡查看相關經濟數據。此時需要擁有支援地理空間圖疊上即時分析內容等多種視覺化內容的工具,以進行這類導向學習及資料發現活動。

這些使得分析師能快速交互地發掘潛在的相關資料集、將選擇的內容投入一組機器學習演算法,再直接呈現調整後之模型的效果,以快速掌握災害的影響性。

身為 GOAI 的創立成員且推動在 GPU 上進行端對端分析,MapD 將出席6月28-29日於紐約舉行之 O’Reilly 人工智慧大會(展位編號#13),演示該倡議的首件企畫案。請見使用美國抵押貸款資料集的 GPU Data Frame(GDF)演示內容。GDF 是一款通用 API,能在 GPU 上運行的各作業間有效率地交換資料。

在此也邀請你參加8月2日週三上午10點(太平洋時區)舉行的最新網路研討會活動,NVIDIA 的 Jim McHugh 和我本人將以開放源碼社群為題開講