ChatRTX 為 NVIDIA RTX AI PC 量身打造聊天機器人

此一技術展示內容讓所有 RTX GPU 用戶都能享受到強大的個性化 GPT 聊天機器人
作者 NVIDIA Corporation

在配備 NVIDIA GPU 的雲端伺服器的支援下,全球每天有數百萬人都在使用聊天機器人。現在這些開創性工具將出現在搭載 NVIDIA RTX 處理器的 Windows PC 上,以便讓人在本機端快速使用量身打造的生成式人工智慧(AI)

現已開放免費下載的技術展示內容 ChatRTX,透過本機端的 NVIDIA GeForce RTX 30 系列或更高規格的 GPU 且具備8GB 以上視訊隨機存取記憶體(VRAM)加速,可以讓使用者以自己的內容打造個人專屬的聊天機器人。

變身「包打聽」

ChatRTX 利用檢索增強生成(RAG)、NVIDIA TensorRT-LLM 軟體及 NVIDIA RTX 加速技術,將生成式 AI 功能引入有著 GeForce 技術支援的 Windows PC。使用者可以快速、輕鬆地將 PC 本機端上的檔案當成資料集,連接到 Mistral 或 Llama 2 這一類開源大型語言模型,以便快速查詢與上下文有關的答案。

使用者無需搜尋筆記或儲存的內容,只要在 ChatRTX 工具輸入查詢內容,如「我的夥伴推薦拉斯維加斯的哪一間餐廳」等,該工具就會掃描使用者指向的本機端檔案,並且按照上下文提供答案。

ChatRTX 工具支援包括 .txt、.pdf、.doc/.docx 和 .xml 在內的多種檔案格式,將應用程式指向有著這些檔案的資料夾,ChatRTX 工具就會在幾秒鐘內將它們載入到檔案庫中。

此外,使用者還能加入 YouTube 影片和播放清單裡的資訊。在 ChatRTX 工具裡輸入影片網址,使用者便能整合這些知識與聊天機器人,並進行上下文查詢,例如根據使用者最喜歡的網紅發布的影片內容推薦的旅遊資訊,或是依照頂尖學習資源獲得教學影片和操作方法。

ChatRTX 可以將 YouTube 影片內容的知識加入查詢結果。

ChatRTX 可以在 Windows RTX PC 和工作站上以本機端的方式運行,能夠快速提供查詢結果,且使用者的資料仍能保留在裝置上。與依賴雲端環境的 LLM 服務不同,ChatRTX 無需分享給第三方或是連結到網路,能讓使用者在 PC 本機端上處理敏感資料。

ChatRTX 的使用需配備 GeForce RTX 30 系列或更高版本 GPU 且具備 8GB以上 的 VRAM ,並搭配作業系統 Windows 10 或 11 和最新的 NVIDIA GPU 驅動程式。

使用 RTX 開發以 LLM 為基礎的應用程式

ChatRTX 展現出利用 RTX GPU 加速 LLM 的潛力,這款應用程式使用 GitHub 上的 TensorRT-LLM RAG 開發者參考專案構建而成。開發者可以使用該參考專案,為 RTX 開發和部署以 RAG 為基礎的私人應用程式,並且由 TensorRT-LLM 進行加速。深入瞭解如何建立以 LLM 為基礎的應用程式

NVIDIA RTX PC 生成式人工智慧開發人員競賽活動現正火熱展開中,參賽者在 2 月 23 日(五)前繳交一款由生成式 AI 支援的 Windows 應用程式或外掛程式,就有機會贏得 GeForce RTX 4090 GPU、NVIDIA GTC 大會全程現場演講通行證等多項好禮!

深入瞭解 ChatRTX