NVIDIA 發表為代理型 AI 應用提供安全防護的 NIM 微服務

AI 代理為全球數十億名知識工作者提供可完成各種任務的「知識機器人」，改變他們的生產力。而為了開發 AI 代理，企業需要解決信任、安全、保全及法遵等關鍵問題。

作為 NVIDIA NeMo Guardrails 軟體工具集的一部分，全新用於人工智慧（AI）防護工作的 NVIDIA NIM 微服務是一款可攜式且經過最佳化的推論微服務，可以協助企業提高其生成式 AI 應用的安全性、精確性與可擴充性。

NeMo Guardrails 是這些微服務的協調核心，也是用於彙整、客製化和為 AI 提供保護的 NVIDIA NeMo 平台一部分。NeMo Guardrails 可協助開發人員在大型語言模型（LLM）應用中整合與管理 AI 防護工作。Amdocs、Cerence AI 和 Lowe’s 等業界領導廠商均使用 NeMo Guardrails 來保護 AI 應用。

開發人員可以使用 NIM 微服務來建立更安全、更值得信賴的 AI 代理，在特定情境的指引下提供安全且適當的回應，並且加強防禦嘗試越獄的行為。這些代理可以部署在汽車、金融、醫療保健、製造和零售等產業的客戶服務中，以提升客戶滿意度和信任度。

其中一個新的微服務是為了控制內容安全而建立，使用 Aegis 內容安全資料集（Aegis Content Safety Dataset）進行訓練，該資料集是同類型中品質最高、經人工註解的資料來源之一。Aegis 內容安全資料集由 NVIDIA 編輯和擁有，並在 Hugging Face 上公開提供，其中包括超過 35,000 個經人工註解的資料樣本，標示為 AI 安全和試圖繞過系統限制的越獄行為。

NVIDIA NeMo Guardrails 讓 AI 代理保持正常運作

AI 正在快速提升各種業務流程的工作效率。在客戶服務方面，AI 協助解決客戶問題的速度加快了 40%。然而，為客戶服務及其他 AI 代理擴大 AI 規模需要輔以安全的模型，以避免輸出有害或不當內容，並且確保 AI 應用的按照訂定的參數運作。

NVIDIA 為 NeMo Guardrails 推出三款全新的 NIM 微服務，可協助 AI 代理大規模運作，同時確保行為受到控制：

內容安全 NIM 微服務可避免 AI 產生偏見或有害的輸出內容，確保回應內容符合道德標準。
主題控制 NIM 微服務使得對話專注於經核准的主題上，避免離題或出現不當內容。
越獄偵測 NIM 微服務可增加對越獄嘗試的防護，協助在對抗性情境中維持 AI 的完整性。

透過應用多種輕量、專用的模型作為防護措施，開發人員可以補足只有適用於一般情況的全面性政策與保護措施時可能出現的缺口，因為一體適用的做法無法妥善保護與控制複雜的 AI 代理工作流程。

小型的語言模型，如 NeMo Guardrails 系列中的模型，可提供較低的延遲，即使在資源有限或分散式環境中也能高效率地執行。這使得它們成為醫療保健、汽車和製造業等產業在醫院或倉庫等地點擴大 AI 應用範圍的理想選擇。

業界領導廠商與合作夥伴利用 NeMo Guardrails 保護 AI

開放給開源社群使用的 NeMo Guardrails，可協助開發人員協調多種稱為 rails的 AI 軟體原則，以增強大型語言模型應用的安全性與控制能力。它可以與 NVIDIA NIM 微服務搭配使用，提供建置 AI 系統的強大框架，並在不影響安全性或效能的情況下進行大規模部署。

Amdocs 是全球領先的通訊與媒體公司軟體及服務供應商，該公司正使用 NeMo Guardrails 提供更安全、準確且符合情境的回應內容，以強化 AI 驅動的客戶互動。

Amdocs 科技事業群總裁暨策略部門主管 Anthony Goonetilleke 表示：「像 NeMo Guardrails 這樣的技術對於保護生成式 AI 應用的安全來說是非常重要的，能夠確保它們能安全且符合道德標準地進行運作。透過將 NVIDIA NeMo Guardrails 整合至 amAIz 平台，我們強化了平台的『可信任 AI』功能，以提供安全、可靠且具擴充能力的代理體驗。這讓服務供應商能夠安全放心地部署 AI 解決方案，為 AI 創新和卓越營運樹立新標準。」

專為汽車產業提供 AI 解決方案的 Cerence AI 正在使用 NVIDIA NeMo Guardrails 來協助確保其車載助理能夠在該公司 CaLLM 系列大小語言模型的支援下，提供符合情境的安全互動。

Cerence AI 產品與技術部門執行副總裁 Nils Schanz 表示：「Cerence AI 仰賴 NVIDIA 的高效能、安全解決方案來支援我們的車載助理技術。使用 NeMo Guardrails 能夠幫助我們為汽車製造商客戶提供可信賴的情境感知解決方案，並且提供合理、貼心且無幻覺的回應。NeMo Guardrails 還能配合汽車製造商客戶的需求進行客製化，同時協助我們過濾有害或令人不愉快的請求，確保我們的 CaLLM 語言模型系列不會向終端使用者傳送非預期或不當的內容。」

領先的家居裝修零售商 Lowe’s 正在使用生成式 AI 來培養店員具備深厚的專業知識。這些工具能夠讓店員取得更全面的產品知識，協助他們回答客戶的問題，並幫助找到完成裝修案所需的合適產品，同時為零售創新和客戶滿意度立下新標準。

Lowe’s 資料、AI 與創新部門資深副總裁 Chandhu Nair 表示：「我們一直在尋找方法幫助員工為客戶提供超乎期望的服務。透過最近部署的 NVIDIA NeMo Guardrails，我們可以確保 AI 產生出安全、穩妥且可靠的回應，為對話內容設下邊界，只提供相關且適當的內容。」

為了進一步加快在零售業 AI 應用開發和部署的過程中採用 AI 防護措施，NVIDIA 最近在 NRF 大會上宣布，其適用於零售購物助理的 NVIDIA AI Blueprint 整合 NeMo Guardrails 微服務，以在數位購物體驗中創造更可靠、控制程度更高的客戶互動。

顧問業領導廠商 Taskus、Tech Mahindra 與 Wipro 也將 NeMo Guardrails 與該公司的解決方案進行整合，為企業客戶提供更安全、可靠且可控的生成式 AI 應用。

NeMo Guardrails 具有開放性和可擴展性，可與領先的 AI 安全模型和防護解決方案供應商，以及 AI 可觀察性和開發工具組成的強大的生態系進行整合。它支援與 ActiveFence 的 ActiveScore 整合，可以過濾對話式 AI 應用中的有害或不當內容，並且提供可視性、分析與監控等功能。

Hive 以 NIM 微服務的方式提供該公司針對圖片、影片和聲音內容的 AI 生成內容偵測模型，可輕鬆整合至使用 NeMo Guardrails 的 AI 應用中並進行協調。

Fiddler AI Observability 平台能輕鬆與 NeMo Guardrails 整合，強化 AI 防護功能的監控能力。而端對端的 AI 開發者平台 Weights & Biases，則是透過加入與 NeMo Guardrails 微服務的整合，來擴充 W&B Weave 的功能。這項增強功能建立在 Weights & Biases 現有的 NIM 整合產品組合上，能夠在生產環境裡最佳化 AI 推論結果。

NeMo Guardrails 提供 AI 安全測試開源工具

準備測試應用安全防護模型和其他 rails 效果的開發人員，能夠使用 NVIDIA Research 團隊開發用於掃描大型語言模型及應用程式漏洞的開源工具包 NVIDIA Garak。

透過使用 Garak，開發人員可以評估使用大型語言模型的系統是否存在資料外洩、提示注入、程式碼幻覺和越獄情境等問題，從而找出系統中的漏洞。Garak 可以藉由產生涉及不適當或不正確輸出內容的測試案例，協助開發人員偵測及解決 AI 模型中的潛在漏洞，以提升其穩健性與安全性。

上市時程

NVIDIA NeMo Guardrails 微服務，以及用於協調 rail 的 NeMo Guardrails 和 NVIDIA Garak 工具包，現已提供給開發人員和企業使用。開發人員可以利用此教學內容開始使用 NeMo Guardrails，為用於客戶服務的 AI 代理建置 AI 防護措施。

軟體產品資訊請參見公告。