在電信導入 AI 的初期部署時效性 5G 網路

作者 NVIDIA

電信供應商正在經歷企業轉型。他們將缺乏敏捷性、靈活性和效率的傳統網路基礎架構,改換成商用現成(commercial off-the-shelf,COTS)白箱伺服器,以協助建置 5G 以及將資料中心現代化。5G 是提升網路容量和頻寬的基礎,但是將也可能會導致目前的網路架構難以負荷。

移轉至 5G 的主要難題為傳統的無線電存取網路(RAN)。目前的 RAN 架構無法處理 5G 需要的額外容量、不具備提供新服務需要的敏捷性,且無法滿足新的擴充性需求。解決此問題的方法是將 RAN 虛擬化和雲端化,以使用 COTS 伺服器以及軟體定義網路(SDN)和網路功能虛擬化(NFV)的分層,實現動態的服務重新配置。

軟體定義天線系統或虛擬 RAN(VRAN)可以為蜂巢式網路業者,帶來雲端服務供應商為客戶提供的運作效率。業者可以在高階軟體中設計網路功能,使用 AI 增加新的創收服務,同時在需要的時間和位置立即部署容量。NVIDIA 具有獨特的優勢,提供在整個堆疊中創新,以建立高效能 5G 網路需要的工具。

5T 用於 5G 具時效性的網路

在移轉至 5G 的過程中,必須在網路邊緣端進行許多必要的架構變更,特別是在 vRAN 或雲端原生 RAN (cloud-native RAN,CloudRAN)中。在這些交界處,時脈同步是一個長期存在的問題。無線電資源單元(RRU)與基頻單元(BBU)之間的前傳存取網路,需要精確的時間同步,以管理無線電資源和無線電訊號處理。

目前以 CPU 和 FPGA 為基礎的時間同步替代方案具有明顯的缺點。在通用 CPU 上無法精確地執行時間同步軟體。FPGA 可以提供靈活性,但是由於功率預算和價格偏高,使 CAPEX 和 OPEX 方面的效率不足。因此 FPGA 通常適合利基點功能,卻不一定適合需要高效率和效能的主流網路功能。

將 RAN 虛擬化的好處,如下所示:

  • 行動網路協調、集中和虛擬化
  • 在網路邊緣啟用新服務
  • 支援資源集區(更具成本效益的處理器共用)和負載平衡
  • 可以從高容量單元擴充至低容量單元(靈活的硬體容量擴展)
  • 層次互作(應用層與 RAN 之間的耦合更緊密)

NVIDIA 提供的突破性技術是針對電信公司的時間觸發傳輸技術(Time-Triggered Transmission Technology for Telco,5T 用於 5G),又稱為 5T for 5G。5T for 5G 可以在前傳與中傳網路之間實現極度準確的時間同步,為電信業者提供更高的效能、更準確的時序,並降低推行 5G CloudRAN 的成本。

5T for 5G 是採用 NVIDIA ConnectX-6 Dx SmartNICBlueField-2 資料處理單元(DPU)。ConnectX-6 Dx 是業界首見的 SmartNIC,可為強化型通用公共無線電介面(eCPRI)提供超精確的時間同步。其提供了 5 合 1 解決方案:

  • 高網路傳輸量
  • 低延遲網路連線能力
  • 低功率需求
  • 各種硬體內加速功能
  • 5T for 5G 時間同步

因此,ConnectX-6Dx 和 BlueField-2 不需要昂貴與耗電的 FPGA 裝置。

5G CloudRAN 架構將 AI 與智慧網路結合

NVIDIA EGX A100 邊緣伺服器平台包含搭載 5T for 5G 技術的 ConnectX-6 Dx,可為軟體定義硬體加速 5G 無線電存取網路提供理想的參考架構,以使所有的連線都保持準時。EGX A100 包含具備 ConnectX-6 DX SmartNIC 的 NVIDIA Ampere 架構。Ampere 可以執行各種運算密集型工作負載,包括 AI 推論和 5G 應用程式,以將大型或小型伺服器變成安全的 AI 超級電腦。

AI 是運用於邊緣端驅動 5G CloudRAN 和應用程式,以及許多深度學習應用程式演算法。AI 可以收集與分析客戶和機器資料,以預測客戶的需求、安全地管理價值交易,並以個人化方案快速回應。由於需要平行執行任務的能力,因此需要可以利用大規模平行的架構,於此情形下,GPU 比 CPU 更適合。

同樣地,5G 可以在各種頻率下運作,以支援新的應用及克服延遲敏感性條件。例如,可能必須以僅 16 ns 的時間準確度執行調度。ConnectX-6Dx 以及 NVIDIA EGX A100 平台有助於在 100 微秒的緊密時間範圍內,解決複雜的調度問題。AI 可以即時自動找出與解決問題,進而將 5G 網路最佳化。例如,AI 可以找出新的方式,在單一頻段上提供多種服務,以改善無線頻譜。

ConnectX-6 Dx 網路卡提供高達 200 Gbps 的資料傳輸量,可以直接傳送至 GPU 記憶體,以進行 AI 和 5G 訊號處理。同時 5T for 5G 技術與 EGX A100 可以結合成雲端原生軟體定義加速器,處理 5G 帶來之延遲敏感性的使用案例。其提供了極致的 AI 和 5G 平台,在行動點做出智慧化即時決策。

NVIDIA Aerial SDK 加快 NVIDIA GPU

在頻寬增加和部署 vRAN 後,x86 核心很難追上步伐。它們需要的功耗開始變得不可行。大量運算的實體層(PHY)和調度工作負載需要硬體加速。雖然存有硬體加速的替代途徑,但是這些方法通常需要使用 FPGA 或 ASIC 進行自訂。由於需要特定的程式設計,因此排除採用 COTS。另一方面,GPU 投入運算的晶片區域大於 CPU。隨著技術的演變,GPU 將高效能運算和 AI 工作負載最佳化,CPU 則專注於較多樣化的工作負載,例如資料庫和辨公室應用程式。

電信業者需要提供高效能,以及可以在網路邊緣做出智慧化即時決策的新型網路架構。傳統的 4G 無線解決方案無法快速地重新配置。將會對 5G 網路切分之發展前景帶來更大的挑戰。網路切分可以讓電信業者以動態方式(逐工作階段),為客戶提供獨特的服務。VRAN 是在最接近客戶的邊緣無線基礎架構中執行,對於建立可以在共同平台上執行動態布建之各種應用程式的現代 5G 基礎架構而言,至關重要。

為了能滿足這些不斷升高的需求,NVIDIA Aerial SDK 針對基頻訊號和資料流,將 GPU 上的平行處理最佳化,以提供建構高效能雲端原生 5G 應用程式的應用程式框架。Aerial 提供兩個關鍵 SDK,使用搭載 NVIDIA GPU 的現成伺服器,簡化建立高度可擴充、可程式化之軟體定義 5G RAN 網路的任務:

  • CUDA 虛擬網路功能(cuVNF)-提供最佳化輸入/輸出和封包處理,從 ConnectX-6Dx SmartNIC 直接將 5G 封包傳送到 GPU 記憶體。
  • CUDA 基頻(cuBB)-提供 GPU 加速 5G 訊號處理工作流程,包括適用於 L1 5G PHY 的 cuPHY。其可將所有實體層處理保持在 GPU 的高效能記憶體中,實現前所未見的傳輸量和效率。

將 NVIDIA EGX Edge AI 平台與 A100 GPU 搭配使用,可以從 CPU 卸載工作負載,並採取極端的多執行緒方法進行資料處理。由於每一個晶片區域的有效核心計數通常比時脈速率增加地更快,因此將會隨著時間而產生持續的縱向擴充效果。GPU 已部署於各大雲端平台,並在各產業中執行無數的 AI 工作負載,且經證實適合在 COTS 硬體設計中使用。

在 NVIDIA EGX Edge 平台上執行的 NVIDIA Aerial SDK,可以有效率地處理過去由低效率之 FPGA NIC 完成的虛擬 BBU 功能。CPU 與 GPU 加速的組合,甚至可以處理最嚴苛的 5G 使用案例。透過此方法,GPU 可以常駐於任何位置,且可使用 Kubernetes 協調整個流程。將可在完全軟體定義、硬體加速的高效能平台上,實現靈活、有時限的服務,並降低推行 5G 的成本。畢竟,在 5G使用分解的情況下,將 GPU 安裝至每一個伺服器中沒有太大的意義。分解 GPU 是符合邏輯的做法。

ConnectX-6 Dx SmartNIC 加快 CloudRAN

電信業者在將更多網路元件轉換成雲端原生功能後,即可建立支援導入軟體驅動服務,以加快創新的開放式敏捷平台。透過此種包含微服務和容器的新架構,可以由分解的運算元件組成資料中心,並量身打造至可配合獨立工作負載需要的形狀和大小。網路結構使此情形成為可能。

NVIDIA ConnectX-6 Dx SmartNIC 可以在東西向流量變得極高的情況下進行分解。由於高速網路、強大的卸載以及精確的時間同步,而使以 ConnectX-6 Dx NIC 為基礎的結構變得更容易組成。此外,提升了利用率及傳輸量。ConnectX SmartNIC 提供的 GPUDirect 功能,帶來比傳統 FPGA 更好的封包放置和步調。GPU 資料平面開發套件(Data Plane Development Kit,DPDK)可以繞過作業系統、填充 DPDK 佇列,並加快 GPU 與 CPU 及其他 GPU 的通訊。

將先進的 5T for 5G 技術嵌入 ConnectX-6 Dx SmartNIC,可以確保 16ns 以下之時脈的準確度,且超越以 eCPRI 為基礎之 RAN 嚴格的業界標準時序規格。讓以封包為基礎的虛擬化乙太網路 RAN,可以提供精準的封包時間戳記以及高度準確的時間參考。進而使網路可以有效率地處理時效性網路流量。eCPRI 時間範圍等獨特功能可以在 O-RAN 規格規定的 1 uSec 傳輸時間範圍內,將 eCPRI 乙太網路封包準確地從分散式單元(DU)傳輸到無線電單元(RU)。

加速交換和封包處理(ASAP2)時限封包流引擎,使軟體定義硬體加速虛擬網路功能(VNF)和容器化網路功能(CNF)可以根據網路服務和應用程式的需要,精確控制進出方向的流量。因此,時序參考、準確度和精度皆可延伸至 ASAP2 以及 ConnectX-6 Dx 支援的所有其他加速引擎。

NVIDIA 可以在完全軟體定義、硬體加速的高效能平台上,實現靈活、有時限的服務,且無須使用 FPGA 進行時間同步。其可為雲端服務供應商(CSP)提供更好的服務敏捷性、網路擴充性,並能以更低的成本與雲端應用程式進行整合。此外,將 GPU 置於任何位置的能力,有助於加速與提高利用率和容量。組合式網路使一切成為可能。

結論

5G 突破所有服務供應商網路的極限。變化不僅發生在核心資料中心,同時發生在網路邊緣端和無線電存取網路。CloudRAN 可以在數十億個裝置連線至 5G 網路的情況下,確保以隨需方式快速部署和適應的能力。因此必須快速進行網路變更。RAN 雲端化是行動裝置問世以來最重大的轉變。

電信業者需要快速、時間同步、精確、可負擔及安全的網路,以推行 5G。關鍵在於具有高可程式性、擴充性和效能,並將智慧加速器和卸載與低延遲快速封包處理能力,以及邊緣 GPU 加速結合的解決方案。其可充分利用開放原始碼社群,降低延遲及最大化傳輸量,同時提供加速和卸載 CPU。最終,將使 vRAN 可以提高無線通訊服務的效能,且大幅超越傳統的 RAN,並能大幅降低營運支出。