清华瑞莱联合团队:“安全增强版DeepSeek”可为应用提供坚实基座

2025年02月25日 来源:点击:

中新网北京2月24日电 (记者 张素)2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。

连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。业内专家同时提醒,DeepSeek R1和V3在面对一些安全性挑战时仍存在一定的局限性。

针对“安全对齐机制不足”这一当前开源大模型的通病,清华瑞莱联合团队提出基于模型自我提升的安全对齐方式。“大模型的安全性瓶颈是本质的,只有通过持续投入和攻坚补齐短板弱项,人工智能产业才能真正实现高质量发展。”瑞莱智慧首席执行官田天说。

据介绍,研发团队将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。具体来说,研发团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。

实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间“跷跷板”现象。有评论认为,这为开源大模型安全发展与风险治理提供了创新性解决方案。

田天表示,RealSafe-R1各尺寸模型及数据集,将于近期向全球开发者开源。他进一步指出,这一创新成果将为开源大模型的安全性加固提供有力支持,也为政务、金融、医疗等场景的应用提供更为可靠的坚实基座。(完)

相关文章
  • 【讲习所·奋进的春天】“雄安为世界提供宝贵的发展经验”
    【讲习所·奋进的春天】“雄安为世界提供宝贵的发展经验”

    【本期导读】2017年2月23日,中共中央总书记、国家主席习近平离京,专程前往河北省安新县主持召开河北雄安新区规划建设工作座谈会。习近平强调,“建设雄安新区是一项历史性工程,一定要保持历史耐心,有‘功成不必在我’的精神境界。”八年过去了。这一被...

  • E法黔行|网络让普法春风“触屏可及”
    E法黔行|网络让普法春风“触屏可及”

    中新网贵州都匀2月24日电(记者 李骏) 一条视频点赞量超140万,一个普法账号获250万关注,一个新媒体矩阵吸引20亿人次观看;从检察机关的“直播普法”到法院的庭审直播,从司法厅的“黔微普法”到司法局的“苗侗普法”……在贵州,获取法律知识不局限于厚重的...

  • 第一视点丨千年古城 以文润城
    第一视点丨千年古城 以文润城

    清晨的仓桥直街,在第一缕阳光的轻抚下,缓缓苏醒。戴着乌毡帽摇橹的船夫,握着黄酒奶茶打卡的游客,在此完成了一场跨越时间的对话,也在讲述一个关于改变的故事。本世纪初,这里的生活是另外一个样子。20多年前的反差,问题在水里、在路上,根子出在文...

  • 习言道|习近平与陕北农民的一段对话
    习言道|习近平与陕北农民的一段对话

    中新网2月24日电 题:习近平与陕北农民的一段对话“我们这代人有一份情结,扶一把老百姓特别是农民。社会主义道路上一个也不能少,全面小康大家一起走!”2020年5月23日,习近平总书记来到参加全国政协十三届三次会议的经济界委员中间,同他们亲切交谈、共...

  • 【学习读本(35)】坚持把广大信教群众团结在党和政府周围
    【学习读本(35)】坚持把广大信教群众团结在党和政府周围

    中共中央统一战线工作部组织编写的《习近平总书记关于做好新时代党的统一战线工作的重要思想学习读本》(以下简称《读本》)一书,由人民出版社出版,在全国发行。《读本》的出版,有利于广大党员干部群众全面、深入、系统学习习近平总书记关于做好新时代...

  • 习言道|中俄是搬不走的好邻居
    习言道|中俄是搬不走的好邻居

    2月24日下午,国家主席习近平应约同俄罗斯总统普京通电话。习近平主席强调——...

友情链接