英伟达推出 NIM AI 护栏办事，防患模子遭用户“逃狱”

栏目分类

热点资讯

报谈：百度将在3月中旬推出升级版AI模子

上海市卫健委：推动医学东谈主工智能发展，鞭策完善生养复古策略

百度与宁德时期相助，将在AI与自动驾驶限制相助

腾讯旗下“元宝”已入驻微信生计劳动板块：搭载满血版DeepS

IDC：展望2025年天下智能眼镜市集出货量为1280万台，

你的位置：科技前沿网 > 新兴技术 > 英伟达推出 NIM AI 护栏办事，防患模子遭用户“逃狱”

新兴技术

英伟达推出 NIM AI 护栏办事，防患模子遭用户“逃狱”

发布日期：2025-02-25 05:59 点击次数：86

英伟达推出 NIM AI 护栏办事，防患模子遭用户“逃狱”

IT之家 1 月 18 日音信，英伟达文书推出一项名为“NIM”的 AI 护栏办事，该办事现已以英伟达 NeMo 护栏（NeMo Guardrails）套件的格式提供，不错让莳植东谈主员为大说话模子（LLM）添加一系列护栏模范，旨在责罚用户通过辅导词“逃狱”大模子，防患 AI 生成不适合预期的本体。

英伟达暗示，相应 AI 护栏办事套件基于英伟达的 Aegis 本体安全数据集进行考验而成，该数据集包含了 3.5 万个标注的数据样本，并已在 Hugging Face 上公开，IT之家附地址如下（点此拜访）。

英伟达指出，相应 AI 护栏套件具有体积小、效果高的特色，在大部分时局中皆能通达开动，企业不错在莳植 AI 模子时径直镶嵌相应安全套件，不错改善医疗、汽车、制造业等畛域部署的 AI 安全性。

此外，英伟达还提供了公布了一项名为 Garak 的症结扫描用具，用于检测模子的安全性，防患模子可能输出幻觉本体或线路企业里面玄机信息。

上一篇：东信营销再冲港交所，AI营销难掩亏本近况

下一篇：京东方Ａ得到发明专利授权：“欺诈于健康料理系统的随访表单料理模范、健康料理系统”