Kinetica 協助美國郵政署解決大數據的問題,榮獲 HPC 大獎

作者 Jim McHugh

 HPC 大獎
作者 JIM MCHUGH,2016年6月23日
比起美國郵政署在處理每年要遞送超過1500億封郵件的大數據問題,雪、雨和伸手不見五指的夜晚簡直就是小巫見大巫。

在經歷過日漸增加的延遲和詐騙案後,美國郵政署轉向求助於 NVIDIA 與 Kinetica 剛獲得 IDC 之 HPC 卓越創新獎的高效能運算方案來解決郵務工作的問題。

前身稱為 GPUdb 的 Kinetica 推出採用 GPU 技術的解決方案,使得美國郵政署從過去用相當慢的速度來逐批消化資料的作法,改為以流暢的速度來處理複雜事件,用近乎即時的速度來結合多個來源的資料。

這項解決方案能應付全美各地郵局和郵件處理單位 15,000 多名使用者,加上 21.3 萬具掃描機同時產生的資料,而美國郵政署也使用地理空間技術及推理技術,以正確預測和回報即時發生的事件。

美國郵政署從這項近乎即時分析運作方式所獲得的深度見解,去年就送出超過1500億件郵件,行駛距離近7000萬英哩,省下700萬加侖的油料,也減少排放 70,000 噸的碳。

將 GPUs 用在大數據分析工作上

Kinetica 採用 NVIDIA Tesla GPU 加速器將分析工作的速度提高 100 到 1,000 倍,而成本只是使用 CPU 之關聯式資料庫管理系統的零頭罷了。美國郵政署在使用 Kinetica 的方案後,查詢效能比起現有的 RDBMS 提高了 200 倍。

GPUs 大幅提升工作表現的結果,讓美國郵政署接下管理即時數據,同時交出正確完整的報告這項艱鉅的任務。現在能集合大批資料組,並且以視覺化的方式來呈現分析結果,而過去只靠 CPU 來處理是做不到這個程度的。
Kinetica 這些協力廠商使用四月份發表的DGX-1 系統,以及本週在 ISC 發表、用於 PCIe 伺服器的 Tesla P100,就能即時處理更多資料。DGX-1 是怪獸級的系統,配備8具 Tesla P100 GPUs 和 128GB GPU 記憶體的系統,其處理能力與於250具傳統伺服器旗鼓相當。

除了硬體,我們還使用 NVIDIA CUDA 將運算效能推向新的高峰。這項平行運算編程模型採用統一記憶體簡化了作業,加快採用 GPU 加速應用程式的腳步。另外還對高效能圖形分析作業使用 nvGRAPH,加快進行嶄新分析工作的速度。

在我們的隨選網路研討會中,提供更多關於如何通過 DGX-1 來加快深度學習應用項目運算速度的資訊。

圖片提供:Brian Gaid