NVIDIA 刷新大數據分析基準的紀錄

作者 SCOTT MCCLELLAN

NVIDIA 剛向世人展現出一舉刷新舊紀錄的堅強實力,將運行 TPCx-BB 這項大數據分析基準的效能表現提高近 20 倍。

NVIDIA 使用 RAPIDS 開放源碼資料科學軟體庫套件,在 16 台 NVIDIA DGX A100 系統支援的情況下,僅用了 14.5 分鐘便完成了這項基準測試,而先前的紀錄是使用 CPU 系統花了 4.7 小時來完成測試。這 16 台 DGX A100 系統用上了 128 個 NVIDIA A100 GPU 及 NVIDIA Mellanox 網路技術。

TPCx-BB 基準測試結果涵括 30 個查詢。RAPIDS 在 16 台 DGX A100 系統上運行,針對每個查詢 RAPIDS 可以為 10 TB 測試提供以上的相對性能提升。

所有系統忙碌運行:各項軟硬體發揮全力,達到全速前進的結果。

時至今日,組織使用人工智慧來取得深入的見解。TPCx-BB 基準在進行查詢時的特色,是使用 SQL 和機器學習來處理結構化資料,以及使用自然語言處理和非結構化資料,反映出現代資料分析工作流程中的多樣性。

這些非官方的結果表明了一種新的標準,突破這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系。

NVIDIA 在運行此一測試基準時,在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了 Dask,在超高速通訊方面用上了 UCX 開放源碼函式庫,並且在 DGX A100 上加速運行這些技術。

DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、人工智慧訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構 NVIDIA A100 Tensor Core GPU 與 NVIDIA Mellanox 網路技術,整合在一個統包式系統中,使用者可以輕鬆調整這個系統的規模。

平行處理創造出無與倫比的效能表現

TPCx-BB 是一個用於企業的大數據基準,代表實體環境中的 ETL(擷取、轉換、載入)與機器學習工作流程。該基準的三十個查詢項目包括庫存管理、價格分析、銷售分析、推薦系統、客戶區隔和情感分析等大數據分析使用案例。

就算分散式運算系統不斷尋求進步,在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行TPCx-BB 基準測試的突破潛力,而這項測試基準過去僅能在 CPU 系統上運行。

RAPIDS 軟體商業生態體系與 DGX A100 系統在這項測試基準中,加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。

大數據規模的高效率測試基準

在 SF10000 TPCx-BB 的規模方面,NVIDIA 的測試結果代表著分析 10TB 以上資料量的表現。

透過這麼大的資料量進行查詢,當中的複雜度會迅速拉長執行時間,造成資料中心增加在空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心排除這些燙手山芋。

NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加快處理各項繁重的分析工作。

開放源碼社群通力合作,加快發展腳步

許多合作夥伴與開放源碼團體積極參與 RAPIDS TPCx-BB 基準 這項專案。

將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuMLCuPyBlazingSQLDask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別(Named Entity Recognition)則是使用 spaCy

少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。

如需更多關於 RAPIDS 的資訊,請至 rapids.ai