栏目分类
热点资讯
你的位置:科技前沿网 > 数字趋势 > “增强版DeepSeek”来了!清华瑞莱聚积团队推出RealSafe-R1大模子

数字趋势

“增强版DeepSeek”来了!清华瑞莱聚积团队推出RealSafe-R1大模子

发布日期:2025-04-05 14:37    点击次数:155

“增强版DeepSeek”来了!清华瑞莱聚积团队推出RealSafe-R1大模子

2月23日,清华大学与瑞莱智谋聚积团队推出大言语模子RealSafe-R1。该模子基于DeepSeek R1进行深度优化与后检会,在确保性能厚实的基础上,收场了安全性的权贵进步,进展优于被觉得安全性较好的闭源大模子Claude3.5、GPT-4o等,为开源大模子安全发展与风险管制提供了改进性科罚决议。

连日来,国产开源大模子DeepSeek的优异进展令东谈主惊艳,其在当然言语处理和多任务推理方面的身手展现了宽绰的技巧实力,尤其是在复杂问题科罚和创造性任务中进展出色。干系词,DeepSeek R1和V3在濒临逃狱报复等安全性挑战时仍存在一定的局限性。举例,模子可能会被坏心打算的输入误导,生成不稳当预期或不安全的反映。这一安全短板并非DeepSeek所独到的贫穷,而是现时开源大模子的通病,其根柢颓势源于安全对都机制的深度不及。

为此,清华瑞莱聚积团队提议了基于模子自我进步的安全对都神色,将安全对都与自省推理相勾搭,使大言语模子大致通过具有安全意志的念念维链分析来搜检潜在风险,收场基础模子自己身手的自主进化,不错哄骗于多种开源、闭源模子。基于该纪律,团队对DeepSeek-R1系列模子进行后检会,崇拜推出RealSafe-R1系列大模子。实验数据标明,RealSafe-R1安全性进步权贵,在多个基准测试中有用增强了对多样逃狱报复的回击力,并放松了安全与性能之间“跷跷板”鼎沸,进展优于被觉得安全性较好的闭源大模子Claude3.5、GPT-4o等,不仅为DeepSeek生态保驾护航,也为大言语模子诞生了新的安全标杆。

据悉,RealSafe-R1各尺寸模子及数据集,将于近期向群众设立者开源。“大模子的安全性瓶颈是本色的,唯一通过捏续参加和攻坚补都短板弱项,东谈主工智能产业才能真确收场高质地发展。”瑞莱智谋首席实践官田天示意,这一改进恶果将为开源大模子的安全性加固提供有劲相沿,也为政务、金融、医疗等严肃场景的哄骗提供更为可靠的坚实基座。

文/北京后生报记者 温婧

剪辑/胡克青