栏目分类
热点资讯
你的位置:科技前沿网 > 新兴技术 > 英伟达推出 NIM AI 护栏办事,防患模子遭用户“逃狱”

新兴技术

英伟达推出 NIM AI 护栏办事,防患模子遭用户“逃狱”

发布日期:2025-02-25 05:59    点击次数:86

英伟达推出 NIM AI 护栏办事,防患模子遭用户“逃狱”

IT之家 1 月 18 日音信,英伟达文书推出一项名为“NIM”的 AI 护栏办事,该办事现已以英伟达 NeMo 护栏(NeMo Guardrails)套件的格式提供,不错让莳植东谈主员为大说话模子(LLM)添加一系列护栏模范,旨在责罚用户通过辅导词“逃狱”大模子,防患 AI 生成不适合预期的本体。

英伟达暗示,相应 AI 护栏办事套件基于英伟达的 Aegis 本体安全数据集进行考验而成,该数据集包含了 3.5 万个标注的数据样本,并已在 Hugging Face 上公开,IT之家附地址如下(点此拜访)。

英伟达指出,相应 AI 护栏套件具有体积小、效果高的特色,在大部分时局中皆能通达开动,企业不错在莳植 AI 模子时径直镶嵌相应安全套件,不错改善医疗、汽车、制造业等畛域部署的 AI 安全性。

此外,英伟达还提供了公布了一项名为 Garak 的症结扫描用具,用于检测模子的安全性,防患模子可能输出幻觉本体或线路企业里面玄机信息。