Nemotron Labs：AI 代理程式如何將文件轉化為即時商業智慧

編註：此文章是 Nemotron Labs 部落格系列的一部分，探討最新的開放模型、資料集和訓練技術如何協助企業在 NVIDIA 平台上建立專用 AI 系統和應用程式。每篇文章介紹使用開放堆疊在正式環境中創造價值的實用方法，從透明化研究副駕駛到可擴充 AI 代理程式。

現今企業面臨的挑戰是挖掘深藏在各種文件中的寶貴洞見，包括報告、簡報、PDF、網頁和試算表。

通常，團隊會手動檢閱檔案、將資料複製到試算表中、建立儀錶板並使用基本搜尋或範本式光學字元辨識 (OCR) 工具來拼湊洞見，但這些工具往往會遺漏複雜媒體中的重要細節。

智慧文件處理是由 AI 驅動的工作流程，可自動讀取、理解文件內容，並從中擷取洞見。其利用 AI 代理程式和擷取擴增產生 (RAG) 等技術解讀這些文件內的豐富格式，包括表格、圖表、影像和文字，將多模態內容轉化為其他多代理程式系統和人員可輕鬆使用的洞見。

透過 NVIDIA Nemotron 開放模型和 GPU 加速函式庫，組織可為研究、金融服務、法律工作流程等建立 AI 驅動的文件智慧系統。

這些開放模型、資料集和訓練配方已在 MTEB、MMTEB、ViDoRe V3 等排行榜上展現優異的成果，這些是評估多語言和多模態擷取模型的基準。團隊可選擇最佳模型以執行搜尋、問答等任務。

文件處理如何簡化商業智慧

文件智慧系統能從複雜的版面中提取意義、擴充至龐大的檔案庫，並且準確顯示答案來源，在高風險環境中非常實用。這些系統：

可理解豐富的文件內容，超越簡單的文字抓取，從圖表、表格、圖片和混合語言頁面中擷取資訊，並如同人類般處理文件，辨識結構、關係和脈絡。
處理大量的變動資料、平行擷取和處理大量文件集合，並持續更新知識庫。
準確找出使用者需要的內容，協助 AI 代理程式精準找出與查詢最相關的段落、表格或章節，確保回應的精度和準確度。
提供特定頁面或圖表的引文以顯示答案背後的證據，讓團隊可獲得透明度與可稽核性，這對受規管產業而言至關重要。

結果是從靜態文件檔案庫轉變為動態知識系統，直接驅動商業智慧、客戶體驗和營運工作流程。

文件智慧於工作中的應用

以 NVIDIA Nemotron RAG 模型、Nemotron Parse 和加速運算為基礎的智慧文件處理系統已改變各產業的組織從文件中獲得洞見的方式。

Justt：AI 原生退款管理與爭議最佳化

在金融服務業中，付款爭議對商家造成重大的營收損失和營運複雜性，主要因為處理這些爭議所需的證據以非結構化格式存在。交易紀錄、客戶通訊和政策文件通常分散在各系統之間，難以大規模處理，導致爭議處理緩慢、手動且成本高昂。

Justt.ai 提供由 AI 驅動的平台，可大規模將整個退款生命週期自動化。此平台可直接與支付服務供應商和商家資料來源連線以擷取交易資料、客戶互動和政策，然後自動彙整符合卡片網路和發卡機構要求的爭議相關證據。

平台的 AI 驅動爭議最佳化功能搭載 Nemotron Parse，運用預測分析判斷應拒絕或接受哪些退款，以及如何將每個回應最佳化以達到最大淨回收。HEI Hotels & Resorts 等各大飯店業者使用此平台將旗下飯店的爭議處理自動化，在維持客戶關係的同時追回營收。

將以文件為中心的智慧與決策自動化相結合，商家可追回因非法退款而損失的大部分營收，同時減少人工審查工作。

瞭解 Justt 的退款管理工具如何自動處理財務資料，為商家處理爭議。

Docusign：擴充協議智慧

Docusign 是智慧協議管理領域的全球領導者，每天為超過 180 萬個客戶和超過 10 億使用者處理數百萬筆交易。

協議是所有業務的基礎，但其中包含的關鍵資訊往往深藏在文件頁面內。為了取得資訊，Docusign 需要從 PDF 等複雜文件中精準擷取表格、文字及中繼資料，讓組織能更快瞭解並採取行動以應對義務、風險和機會。

Docusign 正在評估 Nemotron Parse，以大規模加深對合約的理解。該模型在 NVIDIA GPU 上運作，將先進的 AI 與版面偵測和 OCR 結合。系統能可靠地解讀複雜表格，並以必要資訊重建表格。這減少對手動修正的需要，確保即使是最複雜的合約，也能以客戶期望的速度和準確性加以處理。

在此基礎上，Docusign 將協議儲存庫轉變成結構化資料以支援合約搜尋、分析和 AI 驅動工作流程，將協議變成商業資產，協助組織及其團隊提高可見性、降低風險並加快決策速度。

Edison Scientific：大規模文獻研究

Edison Scientific 的 Kosmos AI Scientist 協助研究人員探索複雜的科學領域，以綜合文獻、找出關聯並揭露證據。

Edison 需要可快速、準確地從大量 PDF 中擷取結構化資訊的方法，包括傳統的資訊剖析方法通常難以處理的方程式、表格和圖片。

Edison 將 NVIDIA Nemotron Parse 模型整合至 PaperQA 工作流程中，可分解研究論文、為關鍵概念建立索引並根據特定段落提供回應，為科學家改善吞吐量和答案品質。此方法將龐大的研究語料庫轉化為互動式可查詢知識引擎，加快假設產生和文獻回顧。

Nemotron Parse 的高效率能大規模提供高成本效益服務，讓 Edison 的團隊得以解鎖整個多模態工作流程。

使用 NVIDIA 技術設計智慧文件處理應用程式

穩健的領域專用文件智慧管道需要能夠處理資料擷取、嵌入和重新排序的技術，同時確保資料安全並符合法規。

擷取：Nemotron 擷取與 OCR 模型可快速擷取多模態 PDF、文字、表格、圖表和影像，將它們轉換成結構化機器可讀內容，同時保留版面配置和語意。
嵌入：Nemotron 嵌入模型可將段落、實體和視覺元素轉換成針對文件擷取而調整的向量表示，實現語意準確的搜尋。
重新排序：Nemotron 重新排序模型可評估候選段落，以確保呈現最相關的內容作為大型語言模型 (LLM) 的脈絡，提高答案準確性並減少幻覺。
剖析：Nemotron Parse 模型可解讀文件語意，以精準的空間定位和正確的閱讀流程擷取文字和表格。模型克服版面配置變異性，將非結構化文件變成可行動化資料，以提升 LLM 及代理式工作流程的準確性。

這些功能被封裝為 NVIDIA NIM 微服務和基礎模型，在 NVIDIA GPU 上以高效率運作，讓團隊從概念驗證擴充到正式上線，同時將敏感資料保存在他們選擇的雲端或資料中心環境中。

最有效的 AI 系統使用尖端模型與 NVIDIA Nemotron 等開放原始碼模型的組合，由 LLM 路由器分析各項任務並自動選擇最適合的模型。此方法可維持強大效能，同時管理運算成本並提升效率。

開始使用 NVIDIA Nemotron

透過逐步教學瞭解如何使用 RAG 功能建置文件處理工作流程。探索 Nemotron RAG 如何驅動為不同產業量身打造的專用代理程式。

此外，您可以試用 Nemotron RAG 模型和 NVIDIA NeMo Retriever 開放函式庫 (可在 GitHub 和 Hugging Face上取得)，以及 Hugging Face 上的 Nemotron Parse。

加入使用 NVIDIA 企業 RAG 藍圖開發的開發人員社群，此藍圖受十幾家領先業界的 AI 資料平台供應商認可，現在可從 build.nvidia.com、GitHub 和 NGC 目錄中取得。

訂閱 NVIDIA AI 新聞、加入社群，並在 LinkedIn、Instagram、X 和 Facebook 上關注 NVIDIA AI，以掌握代理式 AI、NVIDIA Nemotron 等技術的最新資訊。

探索自調進度影片教學和直播。