鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

NVIDIA推出面向Agentic AI的系统性安全框架原创

发布于 2025-8-4 09:01

浏览

0收藏

随着大语言模型（LLMs）从单纯的文本生成器演化为具备规划、推理和自主行动能力的Agentic系统，其能力大幅提升，但也带来了安全、合规和治理等方面的新挑战。为了应对这些风险，NVIDIA发布了一套开源安全软件套件与后训练安全策略（Safety Recipe），为企业部署Agentic AI提供系统性防护手段。

核心问题与背景

Agentic AI具备更强的自主性和工具使用能力，但也引发以下问题：

内容输出风险：生成有害、带偏见或不合规内容；
安全隐患：易受prompt injection、越狱攻击等威胁；
合规难题：难以匹配企业内部政策与外部监管；
传统防护失效：静态内容过滤与规则策略难以应对动态攻击。

企业迫切需要覆盖全生命周期的系统性对策，确保Agentic系统可控、可监、可审计。

NVIDIA安全策略架构概览

NVIDIA推出面向Agentic AI的系统性安全框架-AI.x社区

NVIDIA的安全策略分为四个阶段，覆盖从训练前到部署后的全流程，从多个方位保证AI安全：

预部署评估

工具/数据：Nemotron、WildGuardMix、garak扫描器；
功能：基于企业政策和安全基准测试模型。

后训练对齐

技术：监督微调（SFT）、强化学习（RL）、On-policy数据融合；
目标：在不影响准确性的前提下提升模型的安全一致性。

在线推理防护

工具：NeMo Guardrails与NIM微服务；
功能：实时内容审查、主题控制、越狱检测。

持续监测与反馈

技术：实时分析+garak扫描；
功能：应对动态攻击与提示注入，持续加强防御能力。

开源资源与数据集

Nemotron Content Safety v2：涵盖广泛有害行为的评估基准；
WildGuardMix：适用于模糊/对抗性提示的内容审查；
Aegis Dataset：35000+条标注样本，支持更精细的分类器开发。

效果与成效指标

在效果和成效方便，NVIDIA安全策略也表现良好！

内容安全性提升6%（88% → 94%），模型准确率无损失；
越狱防御能力提升7%（56% → 63%）；
系统可迭代更新，保障模型在面临新型风险时持续可信。

NVIDIA推出面向Agentic AI的系统性安全框架-AI.x社区

NVIDIA推出面向Agentic AI的系统性安全框架-AI.x社区

企业集成与合作生态

与Cisco AI Defense、CrowdStrike、Trend Micro等合作；
可自定义业务策略、风险阈值和合规要求，实现个性化对齐；
支持开源部署或云端模块化启动，便于快速上手与持续演进。

总结

NVIDIA的Agentic AI安全策略是业界首个公开、全流程、可扩展的安全强化方案，为企业在采用Agentic LLM过程中提供了稳固的信任支撑。它在不牺牲性能的前提下，实现了从模型训练到实时防御的完整闭环，助力企业平衡创新与风险，安全拥抱自治型AI，为未来铺路。

参考

https://developer.nvidia.com/blog/safeguard-agentic-ai-systems-with-the-nvidia-safety-recipe/

本文转载自Halo咯咯作者：基咯咯

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

安全软件套件

赞

收藏

回复

举报

回复

相关推荐

更好、更安全、更不依赖OpenAI，微软的AI新动向，推出大模型安全工具Azure AI

51CTO技术栈 • 3608浏览 • 0回复
更好、更安全、更不依赖OpenAI，微软的AI新动向，推出大模型安全工具Azure AI

51CTO技术栈 • 3435浏览 • 0回复
哈佛、麻省推出面向医学多模态助手—PathChat

Aceryt • 5705浏览 • 0回复
提升RAG系统性能10条策略建议

AIGC观察者 • 3616浏览 • 0回复
一篇模块化RAG之最新全面系统性综述

PaperAgent • 4716浏览 • 0回复
极限套娃，Agent自动设计Agentic系统！

PaperAgent • 3291浏览 • 0回复
提高LLM安全性的分步指南

51CTO内容精选 • 3211浏览 • 0回复
代码审查从此不是形式主义：通过 AI 提升 CI 中的代码质量与安全性

凝固的雨_1 • 5562浏览 • 0回复
谷歌AI推出LAuReL：让神经网络更高效的革命性架构

Halo咯咯 • 4150浏览 • 0回复
多模态RAG构建指南：为AI系统提供更多可能性

51CTO内容精选 • 3415浏览 • 0回复
NVIDIA AI 推出 Fugatto：一个 25 亿参数的音频模型，可从文本和音频输入生成音乐、语音和声音

Halo咯咯 • 3325浏览 • 0回复
Agentic AI 系统设计：AI Agent 智能体架构设计与实践

玄姐聊AGI • 7113浏览 • 0回复
RecKG: 面向推荐系统的标准化知识图谱研究与实现

顿数AI • 3011浏览 • 0回复
安全手册：依托DeepSeek与AI可解释性预防银行欺诈

51CTO内容精选 • 3538浏览 • 0回复
MCP安全噩梦终结者：Agent框架如何重构AI防护新范式？

51CTO内容精选 • 2419浏览 • 0回复
阿里通义WebSailor打破闭源系统性能垄断

AI博物院 • 3172浏览 • 0回复
RAG与Agentic RAG：智能AI系统的进化之路

Halo咯咯 • 1173浏览 • 0回复
构建Agentic RAG系统：智能信息检索的开发人员指南

Halo咯咯 • 2580浏览 • 0回复
NVIDIA 推出Rubin CPX，专为AI推理设计的GPU

Syrupup • 1565浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

Grok-4-Fast：让推理更便宜、更快、更普惠的 AI 19h前发布
阿里开源 Tongyi DeepResearch：科研智能体能力首次追平 OpenAI 19h前发布

热门推荐

2025年五大本地大模型，程序员必看！ 0回复

Qwen3-Max Preview 发布：阿里带来首个万亿参数大模型，挑战长上下文极限 0回复

Google 发布 TimesFM-2.5：更小、更强、更长上下文的时间序列基础模型 0回复

通义千问放大招！4800亿参数MoE架构，Qwen3-Coder厉害在哪里 0回复

智能体主流框架深度研究报告：功能特性、用户群体、技术架构与商业化路径分析 0回复

上一篇：企业AI集成怎么做？关键不是模型，而是 MCP、A2A 和 AG-UI

下一篇： ChatGPT Agent介绍，OpenAI又要放大招了？

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载