現場報導: 黃仁勳為 NVIDIA 2014 GPU 技術大會揭幕

作者 Bob Sherbin

NVIDIA 執行長黃仁勳今早於加州聖荷西為年度 GPU 技術大會揭開序幕。

我們將在太平洋時間 9 點整開始即時報導大會活動,敬請持續關注。

在瀏覽器上按重新整理按鈕即可更新內容。

10:50 a.m. – 這款遊戲是 Valve 的「傳送門 (Portal)」,它是款超棒的解謎遊戲。黃仁勳如此形容。Valve 已將「傳送門 (Portal)」移植到 SHIELD,我們對此感到非常興奮。我實在太興奮了,所以今天,我要免費贈送每位 GTC 與會者一台 SHIELD。此話一出,立刻贏得熱烈掌聲。黃仁勳向台下聽眾致謝。

10:48 a.m. – 黃仁勳向 Audi 致謝,回到台上,站在車旁。「Tegra K1 是未來自動駕駛車的大腦。」

現在,他重述演講重點。共有六項發表: Pascal,NVIDIA 處理器的次世代架構;TITAN Z,NVIDA 有史以來最快的 GPU;VMware 運用 NVIDIA GRID 使虛擬化企業運算普及化;Iray VCA – 世上第一款 iray 加速器,能夠免除製作實體原型的需求: 還有 Jetson TK1,全球首款行動超級電腦,適合機器人等嵌入式應用。

這些全都以名為 CUDA 的統一架構為基礎。我們將 CUDA 帶入電腦、雲端及行動領域。我們的開發團隊所獲得的助力實在非常驚人。同一個計畫在任何領域都能發揮效用。

我還有最後一件事要宣布,這純粹是為了娛樂…它是有史以來最好玩的遊戲之一。

10:44 a.m. – 一輛 Audi A7 自動駕駛車駛向舞台,稍微轉向,面對觀眾。「這其實挺嚇人的,因為車內空無一人。車內有個小個子嗎?沒有。後車廂有個小個子嗎?」黃仁勳問道。結果後車廂是空的。幾年前,自動駕駛車的後車廂滿是運算設備。如今,只需要如同 Android 平板電腦大小的微型電腦模組,就可驅動汽車前進。

10:42 a.m. – 在 CES 上,Audi 高層表示他們需要車用超級電腦,讓汽車能夠自動駕駛。隔天,他們就宣布 Audi 正與 NVIDIA 合作開發 Audi 第一款自動駕駛車。黃仁勳歡迎 Audi 前期開發部部長 Andreas Reich 上台。

黃執行長: 開始之前,我們先讓各位瞭解自動駕駛車需要什麼。這是一輛汽車在停車場緩慢行駛的影片,停車場似乎位在德國 – 至少汽車的車牌很長。這輛車配備攝影機,可在車輛行進時監視兩側。攝影機將影像轉換成 3D 空間,以判斷周遭車輛的遠近。

10:38 a.m. – 黃仁勳現在談論電腦視覺工具庫 VisionWorks,它可應用於駕駛輔助、計算攝影、擴增實境及機器人。次世代 Tegra 的代號為 Erista,它將採用 Maxwell 架構,且更加節能、更加強大。Erista 這個名稱延續我們以超級英雄的名字當作代號的一貫傳統。Erista 的應用層面包括汽車…。

10:36 a.m. – 黃仁勳表示,我們可以利用數量龐大的 2D 影像重新建構 3D 世界。研究界向來採用 CUDA 電腦來執行電腦視覺。如今,我們已能夠透過可隨處直接執行 CUDA 程式的機器人、汽車來實現行動化。黃仁勳發表 Jetson TK1 – 全球第一款適用於嵌入式系統的行動超級電腦。其具備 192 個 CUDA 核心、執行 326 GFLOPs,並且包含 VisionWorks SDK。售價是 192 美元,也就是一個核心一美元。他表示:「我很高興行銷部對於數字相稱的喜愛勝過對金錢的喜愛。」

10:32 a.m. – 未來走向: 行動 CUDA

黃執行長: 這說來容易,做起來卻非常困難。但 Kepler 可協助我們。目前世上最節能的 10 台超級電腦全都是採用 Kepler 架構與 CUDA。我們將此帶入行動領域,憑藉的是我們在 CES 發表的全球第一個行動超級晶片: Tegra K1。也因此,我們才能夠將 Kepler 架構與我們所做的一切整合。這不是陳腔濫調;它可是晶片大小的超級電腦。它擁有與橡樹嶺國家實驗室的美國最快超級電腦TITAN 相同的 DNA。

這項產品開啟的大門之一,是行動 CUDA 所賦予的電腦視覺。它使得汽車能夠偵測路況、追蹤行人避開他們,以及解讀 3D 場景。

10:29 a.m. – 「與 VMWare 合作讓我們得以實現端對端企業虛擬化。」黃仁勳說道。

10:29 a.m. – 黃仁勳和 Ben 在台上談到 GRID 為 VMwares 的 Horizon 桌面即服務平台帶來的效益。

Ben 表示,虛擬化技術雖已經過長時間的發展,但還是難以將繪圖豐富的應用程式虛擬化。但我們希望能達成此目標,造福數百萬台的桌上型電腦。

Horizon DaaS 解決方案現已推出。Navisite 會是第一個提供此方案的服務供應商。我們目前以 vGPU 開發的 GRID 整合將在 2014 年第 3 季推出,正式上市時間是 2015 年。

10:25 a.m. – 未來走向: GRID,將 GPU 置入雲端,使 GPU 虛擬化並支援分享。這必須解決相當多的問題。但現在全球共有數百項測試正進行當中,各類組織正在運用繪圖豐富的雲端應用程式,如同 Netflix 般進行串流。今天我們宣布,將企業虛擬化帶給全世界的 VMware 公司,在此加入我們的行列。我們的共同願景是讓虛擬化不僅限於資料中心內部,而要能通往客戶端及應用端。因為 GRID,我們才得以實現端對端企業虛擬化。他介紹 VMware 技術長 Ben Fathi 出場。

10:21 a.m. – 黃仁勳現在在台上展示 Honda 的渲染影像。它看起來像張照片,但汽車本身能夠旋轉,這會對設計人員帶來很大的幫助。其中一項應用就是銷售汽車 – 尤其是無法運送給經銷商的昂貴車款。

10:19 a.m. – 19 個 Iray VCA 提供的效能是 Qaudro K5000 工作站的 40 倍,更是 CPU 工作站的 60-70 倍。Iray VCA 售價 5 萬美元,相當於同等數量的工作站價格的六分之一。

10:17 a.m. – 即使汽車被切成兩半,陰影依然逼真。超級電腦現在是模擬 Honda 的內部,我們可以看到令人讚嘆的擬真細節。

10:16 a.m. – Honda 高層井出先生介紹實際量產車的影像。這是一張渲染影像,他可以旋轉視角、毫無延遲地快速解析。影像的每一個畫格所模擬的照片彷彿來自真實世界,逼真呈現汽車的每一個角落和細部。畫面中的所有物體照亮了彼此。我們可以看到門縫處的陰影,看到頭燈的水晶質感穿透而出。總共模擬數十億道光束。此展示影片的執行速度達 1 petaflop (每秒千兆次浮點運算),等同於六年前世上最快的超級電腦。現在展示的是類似汽車電腦斷層掃描的畫面,彷彿用麵包刀將汽車沿縱向切開一樣。六年前若要呈現這樣的畫面,恐怕得耗費 5 億美元。

10:12 a.m. – 現在,黃仁勳將主題轉移到擬真繪圖。他展示兩張都市住宅的影像。其中一張是照片,另一張則是電腦產生的影像。要分辨兩者的差異,幾乎是不可能的事。如此程度的擬真能力,無論在設計、廣告、建築領域都有很大的應用潛力。但直到現在,它的速度還是太慢。Jen-Hsun 現在介紹 Iray VCA – 世上第一台可擴充 iray 裝置。它可大幅加快 iray 的速度,而且你想堆疊多少 VCA,就堆疊多少。你可以掌握驚人的擴充能力。我們的目標是吸引現在採用 iray 的設計人員,讓他們能夠使用 Iray VCA。

10:09 a.m. – 他接著展示靜止的戰鬥場景,機器人倒在地上。把光影效果拿掉後,畫面顯得既單調又無特色。光影顯然是一大關鍵。

10:07 a.m. – 為作統整,黃仁勳展示與 GameWorks 資料庫整合的 Unreal Engine 4 呈現的遊戲畫面。他展示了一段即時產生的動畫,內容是機器人進行激烈的戰鬥。其逼真程度令人瞠目結舌。就像是從 1970 年代的地鐵站躍然而出,效果如同真實拍攝的影片,但卻是機器人在打鬥。即使看到年輕的布魯斯威利走出來,也不會感到意外。它就是這麼逼真。

10:05 a.m. – 接著介紹全球首見的統一物理求解器。流體、織物、剛體,都能彼此產生互動。每一個物理細節都搭配一種物理模擬器效果。這是全球首見的即時統一物理求解器。展示動畫中的流體與銅色的糖錠互動,我們可以清楚看見流體的流動受到阻斷,留下了美妙的尾波。

接下來是擺盪的剛體與綠色煙霧互動的展示動畫。此即時展示動畫所模擬的資料量極為龐大。重點不在於美術設計,而是這一切都能仰賴 GPU 模擬而出。

第三段展示動畫是煙霧與木質地板互動,呈現了毫無格狀的效果。無需美術人員操控,大幅縮減製作動畫的成本。

第四段展示動畫是呈現 3 千 2 百萬立體像素 (3D 像素)。每一個立體像素都包含燃料、密度及溫度的資料。若達到特定溫度,就會點燃、發光。工程師只需描述場景並編寫演算法,就能出現效果。展示動畫呈現的是火焰纏繞球體,陷入火焰中的球體顯得十分華麗。

9:59 a.m. – TITAN Z 能夠帶來什麼?三十年前,Pixar 將全球帶入 CGI 動畫的世界。其早期電影《頑皮跳跳燈》(Luxo Jr.) 光一個畫格就需要一個半小時的渲染時間,動畫效果既自然又優美。而 30 年後的今天,Rhytm and Hues 工作室的作品更是令人嘆為觀止。他們造就了尖端的水波模擬技術。電腦繪圖還不夠。我們還需要模擬。自 Pixar 崛起至今,電腦已經過無數次的進化,但渲染技術仍需要很長的時間才能模擬出海洋、泡沫、浪花等視覺效果。我們同時啟動可程式著色器和頑皮跳跳燈的展示動畫,就是現在看到的畫面。同時進行模擬與繪圖。

他們展示了一個如同《少年 Pi 的奇幻漂流》的場景,夢幻般的模擬海洋,發光的水母,巨大的鯨魚躍出海面,濺起漫天水花後,平穩地游走。其逼真程度足以讓人感覺真的被濺濕了一樣。

9:53 a.m. – 黃仁勳接著談論繪圖卡。參加 NVIDIA 活動,一定會聽到有關繪圖卡的消息。他回顧了 TITAN GeForce GPU 的成功;基本上,TITAN 就是你可以在零售店買到的超級電腦。它不僅受遊戲玩家青睞,也受到設計人員、美工人員及科學家普遍採用。但是下一步呢?他展示一段令人震撼的精彩影片,內容是能夠自行組裝的新型 GPU。他介紹了全新 GPU GeForce GTX TITAN Z 具備 5,760 CUDA 核心、12GB 記憶體,售價 2,999 美元。這款處理器只需要三張 TITAN Z 繪圖卡就足以跟整個 Google 大腦相比。

9:50 a.m. – 全球的機器學習研究成果不計其數。我們可以預測,這會是電腦技術多年來最重要的進展。它帶來的新功能將十分驚人。在 GTC 上會有來自世界各地的企業及研究團隊相互交流,例如 IBM、Flickr、Facebook、DARPA、俄國的 Yandex、日本的 Denso、中國的百度。這會促使我們朝通用翻譯器的方向努力,將我們所說的話翻譯成另一種語言,並且模擬出我們自己的聲音。

9:47 a.m. – Brian 現在展示更具深度、由七個 GPU 運作兩週所訓練而成的神經網路。其運用了 25 exaflops (每秒百億億次浮點運算),以多個自然資料集來訓練電腦。此電腦擅長區分狗的品種。節目開始前,NVIDIA 已請 GTC 與會者分享他們狗狗的照片。現在,Brian 要看看分類器能否辨別狗的品種。首先,電腦正確辨識出大麥町犬,也正確辨識出維茲拉犬,接著又辨識出德國牧羊犬。

9:44 a.m. – 但,一組史丹佛研究團隊開發出運用 GPU 模擬深度神經網路的新方法。先前耗資 5 百萬美元才完成的工作,這個史丹佛研究團隊最近只用 三萬美元就完成了,而且消耗的能源只有 4 kWatt,整整減少 100 多倍。如今,任何大型或小型企業都可以依照 Google 的方式進行機器學習。接下來,NVIDIA 研究分析師 Brian 將為我們展示一些實例,說明神經網路的學習方式。

他教導電腦辨識 NVIDIA 相關物件及 Ferrari 相關物件。NVIDIA 相關物件主要為綠色,Ferrari 主要為紅色。他開始送入影像,但數量只有十幾張。若採取隨機方式,電腦可能只會答對一半。他繼續送入更多影像,接近 72 張,而現在有了更好的分類器,電腦就能全部答對。

接著,他載入了可能會混淆電腦的物件。Brian 載入了綠色 Ferrari 的影像,電腦將其認定為 NVIDIA 產品。他又送入了綠白紅義大利國旗,電腦認為是 Ferrari。

9:37 a.m. – 而這台電腦看了許多臉孔,也看了許多貓。黃仁勳向觀眾展示這台學習三天的電腦所認為的臉和貓的影像。這些影像都模糊不清,難以辨別。但至少是個開始。這顆 Google 大腦總共用了 1,000 個 CPU 伺服器、2,000 顆 CPU、16,000 個核心,消耗 600 kWatt,耗資 5 百萬美元。但十億連結是一隻蜜蜂的突觸數量。因此,要訓練蜜蜂辨識兩種物體,需耗費三天。那麼,將此延伸至人腦,我們擁有 1000 億個神經元,1,000 條連線。如果我們以 5 億張影像來訓練大腦,這一切又更加複雜。如果我們在 Google 大腦中建構與人腦一樣大的東西,就得花上 40,000 年來訓練 Google 大腦進行類似的工作。

9:32 a.m. – 機器學習是指電腦藉由資料進行自我學習。而現今世界充滿著龐大的資料。ML 領域有很多種。其中之一是源自於生物學的深度神經網路。神經元可辨識邊緣。我們看東西的時候,對應的邊緣神經元會亮起,因此,有些邊緣會變成用來辨別耳朵、眼睛、鼻子、地鐵的形態。不知不覺中,我們就已擁有辨識臉部的神經元。邊緣變成形態,形態變成物體。機器學習科學家稱此為物體辨識。教導神經網路辨識影像是極大的挑戰。Google 團隊最近打造了一台具有 1,000 個伺服器的電腦,藉以模擬擁有 10 億個突觸的大腦。他們用 1000 萬張 200×200 像素尺寸的影像來訓練這台電腦,共耗時三天。過程中完全無人監管,這一點相當驚人。基本上,這台電腦是以連續三天觀看 YouTube 的方式來訓練自己。

9:27 a.m. – 那麼,我們如何稱呼這種整合 3D 記憶體和 NVLink 的晶片?我們決定以我們熟悉的科學家的名字為晶片命名;他就是在 17 世紀發明機械計算機的 Pascal。黃仁勳快速講述 Pascal 於 39 歲去世前提出的各項觀點和理論。當他介紹次世代 Pascal 模組的時候,台下響起了掌聲。Pascal 將成為次世代超級電腦、工作站、遊戲用電腦及雲端超級電腦的核心。其大小是 PCIe 卡的三分之一。Pascal 會讓 NVIDIA 按照摩爾定律擴展。我們要如何運用這樣的 flops (每秒浮點運算次數),以及僅有兩張信用卡大小、等同於超級電腦的處理器?機器學習會是應用領域之一。

9:23 a.m. – GPU 具有許多接腳,它是世上最大的晶片,介面極為寬廣。我們能繼續拓寬嗎?這麼做會使得 GPU 變得相當巨大。我們能加快速度嗎?那會耗用過多能源。因此,我們的下一個技術目標是 3D 封裝。我們會將晶片建置在其他晶片上。首先是基底晶圓,在晶圓上建立互連 – 這些晶片上,數以千計的凸塊會翻轉並碰撞基底晶圓。記憶體介面已從數百位元變成數千位元。我們將所有記憶體晶片層層堆疊,並在晶片上打孔。堆疊式 DRAM 堆疊於基板上的晶圓,而基板具有與 GPU 相連的電線,兩者共同構成一個介面,可提供令人難以置信的頻寬量,而頻寬在未來兩年內將會提高 5 倍。其將以 4 倍的能源效率運作。

9:20 a.m. – 我們今天要發表的第一項技術,是名為 NVLink 的重要發明。這是一種晶片之間的通訊通道。編程模型是 PCI Express,但具備了統一記憶體功能,且移動速度比 PCIe 快 5-12 倍。「這是解決此瓶頸過程的一大進展。」黃仁勳說道。

9:15 a.m. – 黃仁勳提到明天新興企業高峰會的重要性,那是一場邀請採用 GPU 的新創公司參與的分場研討會。會議上將有超過三十六間公司一同討論如何改變世界。

9:13 a.m. – 黃仁勳表示,GTC 所牽涉的範圍相當驚人。2010 年的主題是高效能運算。2012 年的主題是能源探勘、生命科學和分子動力學。而今年快速升溫的議題,就是巨量資料分析、機器學習以及電腦視覺。我們現在已涵蓋了量子層面、原子層面、分子層面,甚至是行星層面。

9:08 a.m. – 電影《地心引力》當中的一些酷炫場景就是運用 GPU 製作而成,為觀眾呈現出珊卓布拉克和喬治克隆尼在太空懸浮翻轉的畫面。

9:05 a.m. – 影片開始播放。會場燈光暗下。音量十分震撼,影片中有許多自動駕駛車、反導彈技術、俯衝三角形、醫學研究的場景。

8:55 am – 現在已坐滿了人。時間即將來到太平洋時間早上 9 點。黃仁勳先生非常守時,應該很快就會開始了。

8:50 am – 這是至今最盛大的一場 GTC。與會者來自 50 個國家。場外共有 170 份令人頭痛的研究海報。還有 550 場個別研討會。參加者包括 Pixar、Google、Facebook 等公司、大學研究員、國家實驗室人員,以及採用 GPU 的新創公司。

8:45 am – 一窺後台準備工作,如下。

如欲深入瞭解 Pascal 和堆疊式記憶體請見 NVIDIA GPU 架構團隊高級總監 Denis Foley 撰寫的 Parallel Forall 一文。