人工智慧如何嚴謹檢查影片,讓公司遠離水深火熱的麻煩

作者 Crowd Favorite

人工智慧推論平台協助京東將影片檢測效率提高 40 倍。

串流影片的流量不斷地大幅增長,亳無放緩的跡象。按照思科視覺化網路指數(Cisco Visual Networking Index)的估算,2021年時串流影片的網路流量會是當前流量的四倍。

Facebook、SnapChat 或 YouTube 等網站的用戶會覺得這是個好消息,像是 YouTube 現在擁有十億名以上的用戶(約三分之一的網路總體用戶人數)。然而對於得篩選上傳到其平台之不當或非法內容的企業而言,這是一項天大的難題。

京東是中國第二大企業對消費者的電商業者,將 NVIDIA Tesla GPU 和採用 DeepStream 軟體開發套件(SDK)的深度學習平台用於智慧影片分析作業,使得影片檢測效率提高了40倍。

業務蓬勃發展之際,也得跟上腳步

名列《財富》雜誌全球五百大企業的京東,擁有2.65億名活躍用戶,2016年的交易金額達近一兆人民幣(約合1,540億美元)。京東的開放式電子商務平台 POP 帶動了公司業務快速增長,這個平台允許個體戶上傳產品照片和影片。

這些商店每天都會將大量影片、圖片和文字上傳到 POP 平台,光是一天便上傳了一億件物品照片。京東有責任確保在上傳的圖片和影片裡,沒有任何不當內容。

過去京東需要使用一個 CPU 來處理上傳到 POP 的一支影片。如果想同時處理一千支影片,就得在雲端部署一千個 CPU,這是一項龐大的投資,過程又極其繁雜。

京東為解決處理影片的需求,採用 NVIDIA 所推出,有著 Tesla P40 GPUsDeepStream SDK 及可編程推論加速器 TensorRT 支援的人工智慧推論平台。此平台讓京東能即時辨識及過濾一千支 HD 影片,代表在執行推論影片內容過濾作業時,將處理速度提高了二十倍。

與 CPU 的效能相比,為大量處理深度學習推論作業而開發的 NVIDIA Tesla P40,將京東的處理能力提高了四十倍。搭載四個Tesla P40 GPU 的單部伺服器,可以取代搭載超過50個 CPU 的多部伺服器。

同時進行解碼與分析作業

DeepStream SDK 讓智慧城市和超大規模資料中心,能更輕鬆開發具擴充性的智慧影片分析應用程式。DeepStream SDK 將用於推論的 TensorRT、用於轉碼的 Video Codec SDK,還有各種必要的預處理及資料庋用內容,整合到單一經優化的 API 內。

DeepStream 讓京東能在檢測過程中同時解碼和分析串流影片內容、使用 TensorRT 加快推論速度,還能減少耗電量;還使得京東能掌握大批上傳的影片內容,從而提高影片分析效率。

如今每台採用 NVIDIA 人工智慧平台的伺服器能同時處理二十支影片,讓京東可同時即時推論一千支 HD 串流影片。加上伺服器數量減少了 83%,也為京東省下了大量設備及人力成本。

京東人工智慧與大數據識別/辨識研發部門資深總監 Chen Yu 表示:「京東將 NVIDIA GPU 跟 DeepStream SDK 用於處理智慧影片分析作業,使得我們在處理串流影片方面邁出一大步。感謝 NVIDIA 不斷提高其 GPU 性能。我們現在還能在任何架構上推論串流影片的內容。」

京東改進檢測效率一事,也縮短了店家上傳產品資料到 POP 平台及取得銷售許可的時間,創造出更美好的服務體驗。