GeForce GTX TITAN: 為何最佳遊戲 GPU 同時也是終極 CUDA 開發 GPU?

作者 Roy Kim

新推出的 GeForce GTX TITAN 廣受好評:「效能令人驚艷」(AnandTech)、「工藝精湛的產品」(TechRadar)、「從頭到尾全面超越對手」(HardwareCanucks)。

因此,各地玩家們都將爭相成為第一個擁有此產品的人。除非,CUDA 開發人員搶先一步。

GTX TITAN 與美國橡樹嶺國家實驗室的全球最快超級電腦 Titan 系統皆採用相同的 Kepler 晶片,因此是極致的 CUDA 開發 GPU。

基本上,我們已經在 GTX TITAN 中釋放 Kepler 的最佳運算能力。

價格低於 $1,000 美元的 1.3 Teraflop 產品

GTX TITAN 是首款能讓開發人員享有超越 Teraflop 雙重精密效能的市售 GPU,PC 可藉此轉變成個人超級電腦。這是項重大消息,因為對科學界而言,擁有運算資源及代表能進一步研究。許多科學家必須等待數個月才能使用超級電腦或校園級電腦叢集。

無需繼續等待,GTX TITAN 現在就能輕易地在 PC 上提升 8 倍運算能力,提供的雙精密效能更是下一級市售 GPU GeForce GTX 680 的 5 倍,而且現在就可透過電子經銷商、實體經銷商和各地零售商購買。

Dynamic Parallelism CUDA 更簡便

對尚未加入 CUDA 的開發人員而言,GTX TITAN 是最適合的 GPU,其 Dynamic Parallelism 功能可讓 GPU 在執行階段中為本身建立新工作,藉此更自主地運作,無需受控於 CPU。脫離 CPU 無謂的限制,能讓 GPU 程式開發更加輕鬆,特別是以往 GPU 難以執行的演算法,如分解和解決問題。

Dynamic Parallelism 功能的最佳例子就是幾個月前我們在一篇部落格文章中所述的 Quicksort 範例。透過 Dynamic Parlelism,進行 Quicksort 演算法所需的程式碼行數僅需要以往的一半,且末端程式碼與 CPU 版的演算法基本上一樣。

GeForce 開發 Tesla 部署

GTX TITAN 需安裝在 PC,而 NVIDIA Tesla K20 GPU 加速器則是專為工作站、伺服器和大型超級電腦所打造,如橡樹嶺的 Titan 系統。Tesla 加速器提供最佳叢集效能,能以 100% 可靠度和管理功能完成工作。Tesla 專屬功能包括:

  • NVIDIA GPUDirect RDMA 能提供 InfiniBand 效能
  • Hyper-Q for MPI (GeForce GTX TITAN 支援 Hyper-Q for CUDA Streams)
  • 內部和外部暫存器與記憶體的 ECC 保護
  • GPU 和叢集管理的支援工具,如 Bright Computing、Ganglia。

最棒的是,開發人員享有兩種平台的優勢。透過 GTX TITAN,應用程式的設計和最佳化不僅更密切符合未來的部署環境,也可用於桌上型 PC。之後就可以在 Tesla 架構系統上部署並調整應用程式。

現在就採用 GeForce GTX TITAN

GeForce GTX TITAN 是開發人員的轉捩點,無論您是 CUDA 新手或資深人員,現在就採用 GTX TITAN,其 Kepler 功能將讓您驚歎不已。開發 CUDA 所需的一切資源都在 https://www.nvidia.com.tw/getcuda。若您是初學者,Udacity 的「平行程式開發簡介」開放線上課程是最佳起點。

若您是 CUDA 開發人員,請在下方告訴我們 GTX TITAN 對您的研究有何潛在助益。

若您要進一步瞭解 GPU 如何徹底改變科學、工程與工業界的創新與發展,請務必參加下週在加州聖荷西舉辦的 GPU 科技大會。