新推出的 GeForce GTX TITAN 廣受好評:「效能令人驚艷」(AnandTech)、「工藝精湛的產品」(TechRadar)、「從頭到尾全面超越對手」(HardwareCanucks)。
因此,各地玩家們都將爭相成為第一個擁有此產品的人。除非,CUDA 開發人員搶先一步。
GTX TITAN 與美國橡樹嶺國家實驗室的全球最快超級電腦 Titan 系統皆採用相同的 Kepler 晶片,因此是極致的 CUDA 開發 GPU。
基本上,我們已經在 GTX TITAN 中釋放 Kepler 的最佳運算能力。
![](/wp-content/uploads/2013/09/gtxtitanone-500x271.png)
價格低於 $1,000 美元的 1.3 Teraflop 產品
GTX TITAN 是首款能讓開發人員享有超越 Teraflop 雙重精密效能的市售 GPU,PC 可藉此轉變成個人超級電腦。這是項重大消息,因為對科學界而言,擁有運算資源及代表能進一步研究。許多科學家必須等待數個月才能使用超級電腦或校園級電腦叢集。
![](/wp-content/uploads/2013/09/gtxtitantwo-500x276.png)
無需繼續等待,GTX TITAN 現在就能輕易地在 PC 上提升 8 倍運算能力,提供的雙精密效能更是下一級市售 GPU GeForce GTX 680 的 5 倍,而且現在就可透過電子經銷商、實體經銷商和各地零售商購買。
Dynamic Parallelism 讓 CUDA 更簡便
對尚未加入 CUDA 的開發人員而言,GTX TITAN 是最適合的 GPU,其 Dynamic Parallelism 功能可讓 GPU 在執行階段中為本身建立新工作,藉此更自主地運作,無需受控於 CPU。脫離 CPU 無謂的限制,能讓 GPU 程式開發更加輕鬆,特別是以往 GPU 難以執行的演算法,如分解和解決問題。
![](/wp-content/uploads/2013/09/gtxtitanone-500x271.png)
Dynamic Parallelism 功能的最佳例子就是幾個月前我們在一篇部落格文章中所述的 Quicksort 範例。透過 Dynamic Parlelism,進行 Quicksort 演算法所需的程式碼行數僅需要以往的一半,且末端程式碼與 CPU 版的演算法基本上一樣。
以 GeForce 開發,以 Tesla 部署
GTX TITAN 需安裝在 PC,而 NVIDIA Tesla K20 GPU 加速器則是專為工作站、伺服器和大型超級電腦所打造,如橡樹嶺的 Titan 系統。Tesla 加速器提供最佳叢集效能,能以 100% 可靠度和管理功能完成工作。Tesla 專屬功能包括:
- NVIDIA GPUDirect RDMA 能提供 InfiniBand 效能
- Hyper-Q for MPI (GeForce GTX TITAN 支援 Hyper-Q for CUDA Streams)
- 內部和外部暫存器與記憶體的 ECC 保護
- GPU 和叢集管理的支援工具,如 Bright Computing、Ganglia。
最棒的是,開發人員享有兩種平台的優勢。透過 GTX TITAN,應用程式的設計和最佳化不僅更密切符合未來的部署環境,也可用於桌上型 PC。之後就可以在 Tesla 架構系統上部署並調整應用程式。
現在就採用 GeForce GTX TITAN
GeForce GTX TITAN 是開發人員的轉捩點,無論您是 CUDA 新手或資深人員,現在就採用 GTX TITAN,其 Kepler 功能將讓您驚歎不已。開發 CUDA 所需的一切資源都在 https://www.nvidia.com.tw/getcuda。若您是初學者,Udacity 的「平行程式開發簡介」開放線上課程是最佳起點。
若您是 CUDA 開發人員,請在下方告訴我們 GTX TITAN 對您的研究有何潛在助益。
若您要進一步瞭解 GPU 如何徹底改變科學、工程與工業界的創新與發展,請務必參加下週在加州聖荷西舉辦的 GPU 科技大會。