关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2656人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广汽集团辟谣“一半汽车芯片由格力供应”:并非事实

中新经纬 浏览 2614

LG AI Research发布K-EXAONE:万亿参数模型挑战全球AI格局

科技行者 浏览 2620

日方鼓吹拥核 国防部表态

环球网资讯 浏览 2743

积压10年,3人被封,袁泉这部电影终于定档!

露珠聊影视 浏览 1685

美媒刊文:不要虚张声势了 放弃"战胜中国"的想法吧

环球时报国际 浏览 13644

牛弹琴:2025年最勇敢的一个动作 背后是全世界的震惊

北京日报客户端 浏览 8971

今年春天的裙子,裙摆越大越好看!

LinkFashion 浏览 2021

记者:拓王之战转播源取自现场大屏,所以直播视角混乱+回放过多

懂球帝 浏览 3755

父子在悉尼海滩枪击致16死 中国学生亲历:很怕打中我

上观新闻 浏览 8758

荣耀打破人类纪录,人形机器人需要挤挤“水分”

无相商业趋势 浏览 787

拿地即亮相!首钢·璟瑞长安择址长安街,解锁京西人居新篇

365财经plus 浏览 2419

歼-15舰载战斗机呼啸升空 看战机高速穿山谷

环球网资讯 浏览 4441

特朗普:取消与普京在布达佩斯的会面

央视新闻客户端 浏览 3034

沪电股份:前三季度净利润同比增长47.03%

网易财经 浏览 3574

专家:演习5个区域形成"三面围岛"之势 传递明确信号

环球时报 浏览 24194

亚马逊大裁员,揭示了AI时代残酷的现实

首席商业评论 浏览 3454

高市暗藏意图:引入核武器 获取打击中国腹地能力

国际在线 浏览 15713

遵义市市长黄伟任上被查:16岁考上大学 几天前在参会

红星新闻 浏览 5881

老牌公募中邮基金换帅 张涛接替毕劲松面临权益短板挑战

Daily每日财报 浏览 2971

朱丹周一围带娃大理度假,两人很有夫妻相

凛若秋霜 浏览 317

信达生物与武田制药达成全球战略合作,交易额最高可达114亿美元,股价收跌近2%

红星资本局 浏览 3612
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1