关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2655人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被章若楠、舒淇带火的毛衣,这样穿太时髦了!

LinkFashion 浏览 2478

纽卡赛季前三个英超客场均0-0战平,为英超历史首次出现

直播吧 浏览 4310

初三男生杀害女同学前检索会担什么责 出庭时变胖变白

红星新闻 浏览 7517

今日热点:电影《飞驰人生3》定档春节;大麦否认与黄牛挂钩……

伊周潮流 浏览 2889

深圳“果链女王”拟减持3600万股,公司市值超千亿,正冲刺A+H上市

红星资本局 浏览 2590

朱珠美上热搜的老钱风穿搭,太值得借鉴了!

LinkFashion 浏览 2697

全新MG4、极狐T1和缤果S,都上市不久,分别卖得怎么样?

车轮生活 浏览 3884

网红鹿哈与女友领证结婚,曾自曝7个月赚3500万,鹿晗被波及

扒虾侃娱 浏览 3408

丹麦羽毛球公开赛今日打响,石宇奇迎来世锦赛后首次亮相

懂球帝 浏览 3844

秦雯自曝袭警被抓后,让王家卫捞人找自己?

芊手若 浏览 3433

卡塔尔首相与法国总统举行会谈 重点讨论加沙局势

上观新闻 浏览 3768

马杜罗紧急求助普京:委内瑞拉需要导弹、雷达和飞机

上观新闻 浏览 3431

套现约455亿,李嘉诚又卖了

第一财经资讯 浏览 321

小川航基:没赢下巴拉圭心有不甘;对阵巴西的机会肯定会更少

懂球帝 浏览 3705

男子深夜抢走绍兴金店150多克黄金饰品 逃了5分钟落网

都市快报橙柿互动 浏览 4626

特朗普威胁"对向伊朗供武国征收50%关税" 外交部回应

界面新闻 浏览 56832

日娱大瓜!虎大将军牵涉经济纠纷,而且已婚?

浅色夏么 浏览 4308

2026北京两会|对话市政协委员刘亮:机器人技术迭代提速,北京打通产学研转化链路

北京商报 浏览 2431

父子在亲戚公司上班遇爆炸全身烧伤花费百万 亲戚回应

潇湘晨报 浏览 3735

王祖贤隐退真相曝光!王晶坦言两点

妙知 浏览 3666

于根伟激励全队:付出最大的努力,把最后4轮比赛“咬”下来

懂球帝 浏览 3848
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1