关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2663人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

ACEMAGIC阿迈奇预告M1A PRO+迷你主机,搭载锐龙AI Max+ 395

IT之家 浏览 3131

华为,车企通向“百万级”的捷径?

道哥说车 浏览 2908

全球食品和饮料巨头宣布:计划裁员16000人

环球网资讯 浏览 3722

海南封关首日:30克金饰省近万元 居民排长队买榴莲

极目新闻 浏览 14097

深夜,全线崩跌!发生了什么?

券商中国 浏览 3163

打不开的车门 小米SU7 Ultra成都交通事故细节详解

网易汽车 浏览 2015

邮报:曼联计划升级老特拉福德排水系统,以修复顶棚漏水问题

懂球帝 浏览 2932

辽粤会师全运会半决赛!杨鸣:广东占天时地利人和

体坛周报 浏览 3516

印度砸7000亿卢比吸引日韩造船不料这两国胃口有点大

澎湃新闻 浏览 5538

中方回应是否会向伊朗提供军事支持

澎湃新闻 浏览 1960

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 3836

德佬:我本来不想让KK的团队得逞,但最终不得不把他卖掉

懂球帝 浏览 4499

44岁前TVB花旦有望跟前未婚夫复合

探长影视解说 浏览 2859

登顶Hugging Face GAIA全球榜首!中兴超级智能体终结「AI黑盒」时代

新智元 浏览 3742

换装高功率电机,蔚来 firefly 萤火虫新车申报

IT之家 浏览 3449

全时区・强流动性|ACCM 助力投资人把握贵金属时代红利

商业观察杂志社 浏览 1071

上年纪的女人,别总穿运动鞋和恨天高,这样穿鞋子得体又优雅

静儿时尚达人 浏览 5811

以军称已有87万巴勒斯坦人从加沙城撤离

环球网资讯 浏览 3753

委内瑞拉代总统:我“受够了”来自华盛顿的命令

扬子晚报 浏览 7033

郭德纲相声春晚访谈,透露最新计划

杨仔述 浏览 2626

快看!!这个女演员近日暴瘦!!哦,知道了……

时尚COSMO 浏览 316
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1