NVIDIA 執行長黃仁勳宣布推出 HGX-2,讓伺服器製造商為全球規模最龐大的產業打造更強大的系統。
NVIDIA 執行長黃仁勳宣布推出 HGX-2,這是雲端伺服器平台的一款「基礎材料」,讓伺服器製造商能採用 NVIDIA GPU 打造更強大的高效能運算與人工智慧系統。
黃仁勳週三在 GPU 技術大會台灣站活動表示,HGX-2 是雲端伺服器平台家族的最新成員,此平台的運算能力在五年內成長了500倍,獲得包括各大電腦製造商與獨立軟體開發商在內之商業生態體系的支持。
黃仁勳表示,GPU 在這項運算商業生態體系裡處於核心位置,將為全球市值達數兆美元之多個產業帶來翻天覆地的改變。他說就只是加入更多的運算能力,便為材料科學、能源與醫學等領域帶來一系列的突破性進展。
「如今對於運算能力的需求,較過往都還要更大,我們需要這項運算表現繼續延伸下去,我們需要放大摩爾定律。」黃仁勳對擠滿 GTC Taiwan 會場的兩千多名技術人員、開發員、研究員、政府官員及媒體這麼說。NVIDIA 今年將在全球各大科技重鎮舉辦七場人工智慧相關活動,GTC Taiwan 是其中的第二場。
NVIDIA 將在今年於全球各地舉行七場人工智慧大會,有兩千名嘉賓出席第二場活動。
運算能力大幅增長
黃仁勳長達兩小時的主題演講,為第一天由來自台灣地區及跨國企業之專家率領的開創性人工智慧議題研討活動揭開了序幕。
黃仁勳細述有著 GPU 助力之深度學習技術所推動的科技圈「寒武紀大爆炸」現象。黃仁勳說在不到十年的時間裡,GPU 的運算能力成長了20倍,代表每年成長1.7倍,這個數字遠遠超越了摩爾定律。
黃仁勳表示在人工智慧的推波助瀾下,對此運算能力的需求只會「增長,而不會減緩」。 「在此之前是由人類編寫軟體,軟體工程師只能寫出這麼多的軟體,但機器可不會累。」他打趣道。
「只要有資料,只要知道怎麼建立架構,我們就能打造出規模絕對龐大的軟體。世上每間軟體開發公司都需要擁有一個人工智慧超級電腦。」黃仁勳說。
啟動伺服器提供服務
朝著那個方向邁出的最新一步:第二代 NVIDIA HGX,它也是一個雲端伺服器平台。
HGX-2 加入了 NVIDIA 的 NVSwitch 互聯技術等突破性功能,將16個 NVIDIA Tensor Core GPU 串連起來,形成一個巨大的 GPU。合作廠商將在今年稍晚推出首批搭載 HGX-2 的系統。
「在你們的合作支持下,任何想用這種未來融合運算方式,搭配高效能運算和人工智慧的人都能完成夢想。」黃仁勳說,感謝電腦產業裡所有合作夥伴支持 NVIDIA。「我們提供各種伺服器,可以滿足不同需求。」
NVIDIA 執行長黃仁勳說 NVIDIA 的合作夥伴提供「各種伺服器」。
從大到更大
HGX-2 的核心為:NVIDIA Tesla V100 GPU(搭載 32GB 高頻寬記憶體),能提供125 teraflops 的深度學習運算效能。
使用 NVSwitch 技術串連起多達16個 Tesla V100 GPU,打造出黃仁勳稱為「世上最大的 GPU」。
「每個 GPU 可以同時以每秒 300GB 的速度,跟每一個 GPU 相互傳輸資料,這個速度是 PCI Express 頻寬的十倍。每個 GPU 彼此間都能同時交流資料。」黃仁勳說。
黃仁勳還介紹了 NVIDIA 使用 HGX-2 伺服器平台打造的首款全新 NVIDIA DGX-2 系統。這款搭載 512GB HBM2 記憶體、重350磅的機器,提供了 2 petaflops 的運算能力。
「這是到目前為止人類創造出速度最快的一個電腦:一套作業系統、一個編程模型,可以將它設定為一個電腦。這就像是一個 PC,只是它的運算速度極快。」黃仁勳說。
新的定律
黃仁勳說跟它的前一代相比,DGX-2 只花了六個月的時間就將運算能力提升了十倍。在 AlexNet 影像辨識基準測試方面,相較於五年前使用兩個 NVIDIA GPU 的數據,DGX-2 的表現提升了500倍。
黃仁勳說:「這是新的定律。這個新的運算定律表示,『要是你能做到,且你願意對整個堆疊進行優化,便能快速提升效能。』」
結果:從單晶片性能到龐大的資料中心系統,一系列深度學習技術在技術堆疊裡寫下速度新猷。
NVIDIA 展現出在技術堆疊裡創下紀錄的效能表現。
NVIDIA GPU 雲讓更多人能享受到這項運算能力,使得研究人員可以從桌上型電腦和伺服器系統,改為使用由 Amazon、Google、阿里巴巴及 Oracle 等提供商提供的雲端系統。
「這個軟體的每一層都經過了調整和測試。」黃仁勳說,如今下載 NVIDIA GPU 雲(NGC)的企業數量已達兩萬間。
實際結果令人驚嘆。舞台上的黃仁勳配合 NVIDIA 的人工智慧研究人員,在觀眾觀看之際即時刪除樹木、路燈等照片裡的細節。
克服 PLASTER 七大難題
NVIDIA 執行長黃仁勳說要進行推斷作業並非易事。
除了演示之外,黃仁勳表示大規模部署這樣的深度學習應用程式,還得克服七大難題:即可編程性、延遲性、準確性,規模、處理量、用電能效與學習速度,這七項合稱為 PLASTER。
擴展能力將是新一代人工智慧服務是否能順利運作的關鍵,這是一項稱為推論的過程,適用於語音合成與辨識、影像與影片處理及推薦服務等。
王者 KONG
黃仁勳利用一項花朵辨識系統演示內容,介紹在採用 Kubernetes 快速為更多安裝於桌上型電腦、資料中心及雲端服務提供商處之 GPU 提供支援的情況下,從使用一個 CPU 每秒可辨識四張圖片的速度,到使用一個 GPU 每秒可辨識2,500張圖片,再將那個驚人速度提高四倍。
「我們稱此為 NVIDIA GPU 上的 Kubernetes,也就是 KONG。」黃仁勳說。
GPU 運算能力加上 Kubernetes,可以按照你的需求變得龐大無比。
「你願意的話,Kubernetes 可以是一套超大規模的作業系統。從 GPU 看這整個堆疊,到可以放入 docker 的所有 API 跟函式庫,而這個 docker 在 Kubernetes 上面運行,那麼這個軟體堆疊是如此複雜,是我們數百名工程師多年來的心血結晶。」黃仁勳說。
盛大的新 GPU,盛大的新市場
這些伺服器將為市值數兆美元的多個產業,提供他們無法從它處獲得的運算能力。
- NVIDIA 為市值兩兆美元的娛樂業推出用於加快光線追蹤速度的全新 RTX 技術(電影畫質標準),搭配即時圖形技術與人工智慧,有望為當前的傳統 CPU 驅動渲染農場加快處理速度。
- NVIDIA 為市值七兆美元的醫療保健產業推出 Project Clara 這類專案,可望讓 GPU 運算能力重新定義醫療成像技術,協助現今的醫療儀器提高畫面真實度,或者在減少用電量的情況下產生出相同畫質的影像。此舉可將掃描儀的輻射量減少六倍,以安全用於兒童。
- 安全的城市代表另一項價值兩兆美元的商機。
- NVIDIA 為市值十兆美元的交通運輸市場,提出端對端 DRIVE 平台。黃仁勳說:「未來一切會移動的東西都是自動行駛的。」他介紹 NVIDIA 有能力幫助收集和處理資料、訓練模型、模擬數十億英里的駕駛紀錄與駕車。
縮小到貼合:傳送到狹小空間
黃仁勳在主題演講的最後,使用虛擬實境技術將我們的一名同事變小了,並將他傳送到一輛微型車輛裡,接著這名同事駕車在一座微型城市裡兜風逛大街。
黃仁勳說藉由這項技術,人類就能透過 VR 技術成為人工智慧機器的後援,無論這些機器擺放在何處及其尺寸大小都沒問題。
「日後各位將能跟機器人融為一體,現身在遠處,前往任何你想去的地方。」黃仁勳說。