現場報導: 黃仁勳為 NVIDIA 2014 GPU 技術大會揭幕

NVIDIA 執行長黃仁勳今早於加州聖荷西為年度 GPU 技術大會揭開序幕。

我們將在太平洋時間 9 點整開始即時報導大會活動，敬請持續關注。

在瀏覽器上按重新整理按鈕即可更新內容。

10:50 a.m. – 這款遊戲是 Valve 的「傳送門 (Portal)」，它是款超棒的解謎遊戲。黃仁勳如此形容。Valve 已將「傳送門 (Portal)」移植到 SHIELD，我們對此感到非常興奮。我實在太興奮了，所以今天，我要免費贈送每位 GTC 與會者一台 SHIELD。此話一出，立刻贏得熱烈掌聲。黃仁勳向台下聽眾致謝。

10:48 a.m. – 黃仁勳向 Audi 致謝，回到台上，站在車旁。「Tegra K1 是未來自動駕駛車的大腦。」

現在，他重述演講重點。共有六項發表: Pascal，NVIDIA 處理器的次世代架構；TITAN Z，NVIDA 有史以來最快的 GPU；VMware 運用 NVIDIA GRID 使虛擬化企業運算普及化；Iray VCA – 世上第一款 iray 加速器，能夠免除製作實體原型的需求: 還有 Jetson TK1，全球首款行動超級電腦，適合機器人等嵌入式應用。

這些全都以名為 CUDA 的統一架構為基礎。我們將 CUDA 帶入電腦、雲端及行動領域。我們的開發團隊所獲得的助力實在非常驚人。同一個計畫在任何領域都能發揮效用。

我還有最後一件事要宣布，這純粹是為了娛樂…它是有史以來最好玩的遊戲之一。

10:44 a.m. – 一輛 Audi A7 自動駕駛車駛向舞台，稍微轉向，面對觀眾。「這其實挺嚇人的，因為車內空無一人。車內有個小個子嗎？沒有。後車廂有個小個子嗎？」黃仁勳問道。結果後車廂是空的。幾年前，自動駕駛車的後車廂滿是運算設備。如今，只需要如同 Android 平板電腦大小的微型電腦模組，就可驅動汽車前進。

10:42 a.m. – 在 CES 上，Audi 高層表示他們需要車用超級電腦，讓汽車能夠自動駕駛。隔天，他們就宣布 Audi 正與 NVIDIA 合作開發 Audi 第一款自動駕駛車。黃仁勳歡迎 Audi 前期開發部部長 Andreas Reich 上台。

黃執行長: 開始之前，我們先讓各位瞭解自動駕駛車需要什麼。這是一輛汽車在停車場緩慢行駛的影片，停車場似乎位在德國 – 至少汽車的車牌很長。這輛車配備攝影機，可在車輛行進時監視兩側。攝影機將影像轉換成 3D 空間，以判斷周遭車輛的遠近。

10:38 a.m. – 黃仁勳現在談論電腦視覺工具庫 VisionWorks，它可應用於駕駛輔助、計算攝影、擴增實境及機器人。次世代 Tegra 的代號為 Erista，它將採用 Maxwell 架構，且更加節能、更加強大。Erista 這個名稱延續我們以超級英雄的名字當作代號的一貫傳統。Erista 的應用層面包括汽車…。

10:36 a.m. – 黃仁勳表示，我們可以利用數量龐大的 2D 影像重新建構 3D 世界。研究界向來採用 CUDA 電腦來執行電腦視覺。如今，我們已能夠透過可隨處直接執行 CUDA 程式的機器人、汽車來實現行動化。黃仁勳發表 Jetson TK1 – 全球第一款適用於嵌入式系統的行動超級電腦。其具備 192 個 CUDA 核心、執行 326 GFLOPs，並且包含 VisionWorks SDK。售價是 192 美元，也就是一個核心一美元。他表示:「我很高興行銷部對於數字相稱的喜愛勝過對金錢的喜愛。」

10:32 a.m. – 未來走向: 行動 CUDA

黃執行長: 這說來容易，做起來卻非常困難。但 Kepler 可協助我們。目前世上最節能的 10 台超級電腦全都是採用 Kepler 架構與 CUDA。我們將此帶入行動領域，憑藉的是我們在 CES 發表的全球第一個行動超級晶片: Tegra K1。也因此，我們才能夠將 Kepler 架構與我們所做的一切整合。這不是陳腔濫調；它可是晶片大小的超級電腦。它擁有與橡樹嶺國家實驗室的美國最快超級電腦TITAN 相同的 DNA。

這項產品開啟的大門之一，是行動 CUDA 所賦予的電腦視覺。它使得汽車能夠偵測路況、追蹤行人避開他們，以及解讀 3D 場景。

10:29 a.m. – 「與 VMWare 合作讓我們得以實現端對端企業虛擬化。」黃仁勳說道。

10:29 a.m. – 黃仁勳和 Ben 在台上談到 GRID 為 VMwares 的 Horizon 桌面即服務平台帶來的效益。

Ben 表示，虛擬化技術雖已經過長時間的發展，但還是難以將繪圖豐富的應用程式虛擬化。但我們希望能達成此目標，造福數百萬台的桌上型電腦。

Horizon DaaS 解決方案現已推出。Navisite 會是第一個提供此方案的服務供應商。我們目前以 vGPU 開發的 GRID 整合將在 2014 年第 3 季推出，正式上市時間是 2015 年。

10:25 a.m. – 未來走向: GRID，將 GPU 置入雲端，使 GPU 虛擬化並支援分享。這必須解決相當多的問題。但現在全球共有數百項測試正進行當中，各類組織正在運用繪圖豐富的雲端應用程式，如同 Netflix 般進行串流。今天我們宣布，將企業虛擬化帶給全世界的 VMware 公司，在此加入我們的行列。我們的共同願景是讓虛擬化不僅限於資料中心內部，而要能通往客戶端及應用端。因為 GRID，我們才得以實現端對端企業虛擬化。他介紹 VMware 技術長 Ben Fathi 出場。

10:21 a.m. – 黃仁勳現在在台上展示 Honda 的渲染影像。它看起來像張照片，但汽車本身能夠旋轉，這會對設計人員帶來很大的幫助。其中一項應用就是銷售汽車 – 尤其是無法運送給經銷商的昂貴車款。

10:19 a.m. – 19 個 Iray VCA 提供的效能是 Qaudro K5000 工作站的 40 倍，更是 CPU 工作站的 60-70 倍。Iray VCA 售價 5 萬美元，相當於同等數量的工作站價格的六分之一。

10:17 a.m. – 即使汽車被切成兩半，陰影依然逼真。超級電腦現在是模擬 Honda 的內部，我們可以看到令人讚嘆的擬真細節。

10:16 a.m. – Honda 高層井出先生介紹實際量產車的影像。這是一張渲染影像，他可以旋轉視角、毫無延遲地快速解析。影像的每一個畫格所模擬的照片彷彿來自真實世界，逼真呈現汽車的每一個角落和細部。畫面中的所有物體照亮了彼此。我們可以看到門縫處的陰影，看到頭燈的水晶質感穿透而出。總共模擬數十億道光束。此展示影片的執行速度達 1 petaflop (每秒千兆次浮點運算)，等同於六年前世上最快的超級電腦。現在展示的是類似汽車電腦斷層掃描的畫面，彷彿用麵包刀將汽車沿縱向切開一樣。六年前若要呈現這樣的畫面，恐怕得耗費 5 億美元。

10:12 a.m. – 現在，黃仁勳將主題轉移到擬真繪圖。他展示兩張都市住宅的影像。其中一張是照片，另一張則是電腦產生的影像。要分辨兩者的差異，幾乎是不可能的事。如此程度的擬真能力，無論在設計、廣告、建築領域都有很大的應用潛力。但直到現在，它的速度還是太慢。Jen-Hsun 現在介紹 Iray VCA – 世上第一台可擴充 iray 裝置。它可大幅加快 iray 的速度，而且你想堆疊多少 VCA，就堆疊多少。你可以掌握驚人的擴充能力。我們的目標是吸引現在採用 iray 的設計人員，讓他們能夠使用 Iray VCA。

10:09 a.m. – 他接著展示靜止的戰鬥場景，機器人倒在地上。把光影效果拿掉後，畫面顯得既單調又無特色。光影顯然是一大關鍵。

10:07 a.m. – 為作統整，黃仁勳展示與 GameWorks 資料庫整合的 Unreal Engine 4 呈現的遊戲畫面。他展示了一段即時產生的動畫，內容是機器人進行激烈的戰鬥。其逼真程度令人瞠目結舌。就像是從 1970 年代的地鐵站躍然而出，效果如同真實拍攝的影片，但卻是機器人在打鬥。即使看到年輕的布魯斯威利走出來，也不會感到意外。它就是這麼逼真。

10:05 a.m. – 接著介紹全球首見的統一物理求解器。流體、織物、剛體，都能彼此產生互動。每一個物理細節都搭配一種物理模擬器效果。這是全球首見的即時統一物理求解器。展示動畫中的流體與銅色的糖錠互動，我們可以清楚看見流體的流動受到阻斷，留下了美妙的尾波。

接下來是擺盪的剛體與綠色煙霧互動的展示動畫。此即時展示動畫所模擬的資料量極為龐大。重點不在於美術設計，而是這一切都能仰賴 GPU 模擬而出。

第三段展示動畫是煙霧與木質地板互動，呈現了毫無格狀的效果。無需美術人員操控，大幅縮減製作動畫的成本。

第四段展示動畫是呈現 3 千 2 百萬立體像素 (3D 像素)。每一個立體像素都包含燃料、密度及溫度的資料。若達到特定溫度，就會點燃、發光。工程師只需描述場景並編寫演算法，就能出現效果。展示動畫呈現的是火焰纏繞球體，陷入火焰中的球體顯得十分華麗。

9:59 a.m. – TITAN Z 能夠帶來什麼？三十年前，Pixar 將全球帶入 CGI 動畫的世界。其早期電影《頑皮跳跳燈》(Luxo Jr.) 光一個畫格就需要一個半小時的渲染時間，動畫效果既自然又優美。而 30 年後的今天，Rhytm and Hues 工作室的作品更是令人嘆為觀止。他們造就了尖端的水波模擬技術。電腦繪圖還不夠。我們還需要模擬。自 Pixar 崛起至今，電腦已經過無數次的進化，但渲染技術仍需要很長的時間才能模擬出海洋、泡沫、浪花等視覺效果。我們同時啟動可程式著色器和頑皮跳跳燈的展示動畫，就是現在看到的畫面。同時進行模擬與繪圖。

他們展示了一個如同《少年 Pi 的奇幻漂流》的場景，夢幻般的模擬海洋，發光的水母，巨大的鯨魚躍出海面，濺起漫天水花後，平穩地游走。其逼真程度足以讓人感覺真的被濺濕了一樣。

9:53 a.m. – 黃仁勳接著談論繪圖卡。參加 NVIDIA 活動，一定會聽到有關繪圖卡的消息。他回顧了 TITAN GeForce GPU 的成功；基本上，TITAN 就是你可以在零售店買到的超級電腦。它不僅受遊戲玩家青睞，也受到設計人員、美工人員及科學家普遍採用。但是下一步呢？他展示一段令人震撼的精彩影片，內容是能夠自行組裝的新型 GPU。他介紹了全新 GPU GeForce GTX TITAN Z – 具備 5,760 CUDA 核心、12GB 記憶體，售價 2,999 美元。這款處理器只需要三張 TITAN Z 繪圖卡就足以跟整個 Google 大腦相比。

9:50 a.m. – 全球的機器學習研究成果不計其數。我們可以預測，這會是電腦技術多年來最重要的進展。它帶來的新功能將十分驚人。在 GTC 上會有來自世界各地的企業及研究團隊相互交流，例如 IBM、Flickr、Facebook、DARPA、俄國的 Yandex、日本的 Denso、中國的百度。這會促使我們朝通用翻譯器的方向努力，將我們所說的話翻譯成另一種語言，並且模擬出我們自己的聲音。

9:47 a.m. – Brian 現在展示更具深度、由七個 GPU 運作兩週所訓練而成的神經網路。其運用了 25 exaflops (每秒百億億次浮點運算)，以多個自然資料集來訓練電腦。此電腦擅長區分狗的品種。節目開始前，NVIDIA 已請 GTC 與會者分享他們狗狗的照片。現在，Brian 要看看分類器能否辨別狗的品種。首先，電腦正確辨識出大麥町犬，也正確辨識出維茲拉犬，接著又辨識出德國牧羊犬。

9:44 a.m. – 但，一組史丹佛研究團隊開發出運用 GPU 模擬深度神經網路的新方法。先前耗資 5 百萬美元才完成的工作，這個史丹佛研究團隊最近只用三萬美元就完成了，而且消耗的能源只有 4 kWatt，整整減少 100 多倍。如今，任何大型或小型企業都可以依照 Google 的方式進行機器學習。接下來，NVIDIA 研究分析師 Brian 將為我們展示一些實例，說明神經網路的學習方式。

他教導電腦辨識 NVIDIA 相關物件及 Ferrari 相關物件。NVIDIA 相關物件主要為綠色，Ferrari 主要為紅色。他開始送入影像，但數量只有十幾張。若採取隨機方式，電腦可能只會答對一半。他繼續送入更多影像，接近 72 張，而現在有了更好的分類器，電腦就能全部答對。

接著，他載入了可能會混淆電腦的物件。Brian 載入了綠色 Ferrari 的影像，電腦將其認定為 NVIDIA 產品。他又送入了綠白紅義大利國旗，電腦認為是 Ferrari。

9:37 a.m. – 而這台電腦看了許多臉孔，也看了許多貓。黃仁勳向觀眾展示這台學習三天的電腦所認為的臉和貓的影像。這些影像都模糊不清，難以辨別。但至少是個開始。這顆 Google 大腦總共用了 1,000 個 CPU 伺服器、2,000 顆 CPU、16,000 個核心，消耗 600 kWatt，耗資 5 百萬美元。但十億連結是一隻蜜蜂的突觸數量。因此，要訓練蜜蜂辨識兩種物體，需耗費三天。那麼，將此延伸至人腦，我們擁有 1000 億個神經元，1,000 條連線。如果我們以 5 億張影像來訓練大腦，這一切又更加複雜。如果我們在 Google 大腦中建構與人腦一樣大的東西，就得花上 40,000 年來訓練 Google 大腦進行類似的工作。

9:32 a.m. – 機器學習是指電腦藉由資料進行自我學習。而現今世界充滿著龐大的資料。ML 領域有很多種。其中之一是源自於生物學的深度神經網路。神經元可辨識邊緣。我們看東西的時候，對應的邊緣神經元會亮起，因此，有些邊緣會變成用來辨別耳朵、眼睛、鼻子、地鐵的形態。不知不覺中，我們就已擁有辨識臉部的神經元。邊緣變成形態，形態變成物體。機器學習科學家稱此為物體辨識。教導神經網路辨識影像是極大的挑戰。Google 團隊最近打造了一台具有 1,000 個伺服器的電腦，藉以模擬擁有 10 億個突觸的大腦。他們用 1000 萬張 200×200 像素尺寸的影像來訓練這台電腦，共耗時三天。過程中完全無人監管，這一點相當驚人。基本上，這台電腦是以連續三天觀看 YouTube 的方式來訓練自己。

9:27 a.m. – 那麼，我們如何稱呼這種整合 3D 記憶體和 NVLink 的晶片？我們決定以我們熟悉的科學家的名字為晶片命名；他就是在 17 世紀發明機械計算機的 Pascal。黃仁勳快速講述 Pascal 於 39 歲去世前提出的各項觀點和理論。當他介紹次世代 Pascal 模組的時候，台下響起了掌聲。Pascal 將成為次世代超級電腦、工作站、遊戲用電腦及雲端超級電腦的核心。其大小是 PCIe 卡的三分之一。Pascal 會讓 NVIDIA 按照摩爾定律擴展。我們要如何運用這樣的 flops (每秒浮點運算次數)，以及僅有兩張信用卡大小、等同於超級電腦的處理器？機器學習會是應用領域之一。

9:23 a.m. – GPU 具有許多接腳，它是世上最大的晶片，介面極為寬廣。我們能繼續拓寬嗎？這麼做會使得 GPU 變得相當巨大。我們能加快速度嗎？那會耗用過多能源。因此，我們的下一個技術目標是 3D 封裝。我們會將晶片建置在其他晶片上。首先是基底晶圓，在晶圓上建立互連 – 這些晶片上，數以千計的凸塊會翻轉並碰撞基底晶圓。記憶體介面已從數百位元變成數千位元。我們將所有記憶體晶片層層堆疊，並在晶片上打孔。堆疊式 DRAM 堆疊於基板上的晶圓，而基板具有與 GPU 相連的電線，兩者共同構成一個介面，可提供令人難以置信的頻寬量，而頻寬在未來兩年內將會提高 5 倍。其將以 4 倍的能源效率運作。

9:20 a.m. – 我們今天要發表的第一項技術，是名為 NVLink 的重要發明。這是一種晶片之間的通訊通道。編程模型是 PCI Express，但具備了統一記憶體功能，且移動速度比 PCIe 快 5-12 倍。「這是解決此瓶頸過程的一大進展。」黃仁勳說道。

9:15 a.m. – 黃仁勳提到明天新興企業高峰會的重要性，那是一場邀請採用 GPU 的新創公司參與的分場研討會。會議上將有超過三十六間公司一同討論如何改變世界。

9:13 a.m. – 黃仁勳表示，GTC 所牽涉的範圍相當驚人。2010 年的主題是高效能運算。2012 年的主題是能源探勘、生命科學和分子動力學。而今年快速升溫的議題，就是巨量資料分析、機器學習以及電腦視覺。我們現在已涵蓋了量子層面、原子層面、分子層面，甚至是行星層面。

9:08 a.m. – 電影《地心引力》當中的一些酷炫場景就是運用 GPU 製作而成，為觀眾呈現出珊卓布拉克和喬治克隆尼在太空懸浮翻轉的畫面。