关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1662人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿根廷晋级世青赛决赛,梅西:挺进决赛啦,恭喜所有人

懂球帝 浏览 2676

檀健次恋爱风波越演越烈!本人日本上学经历被扒,全家被质疑亲日

萌神木木 浏览 1662

美媒承认:乌重镇即将被攻克

环球时报国际 浏览 2488

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 2817

张馨予减肥致体质差,170身高仅百斤两月发烧三次

把喜欢都给他 浏览 1403

中国队手下败将逆袭进联合杯四强,袁悦45分钟速败引发网友热议

网球之家 浏览 1676

以军攻势升级 加沙两天内超4万人流离失所

澎湃新闻 浏览 3509

30万的玛莎拉蒂,被一抢而空!超跑皇后暴击中国人

象视汽车 浏览 1938

聂卫平告别仪式在八宝山举行 "一生的对手"冒雪来送别

新民晚报 浏览 5956

特朗普称与北约达成格陵兰合作框架 吕特:没提丹麦

澎湃新闻 浏览 18982

苹果发布iPhone 17e与新款iPad Air,定价不变主打中端市场

华尔街见闻官方 浏览 826

真相来了!前经纪人为保剑锋发声,曝光离婚时间线,实锤男方出轨

萌神木木 浏览 1545

混动加持 保时捷911 Turbo Touring谍照曝光

车质网 浏览 2820

中央批准 开除姜德果、唐德智党籍

北京日报客户端-长安街知事 浏览 41748

财政负担持续累积,“节油意识”难以培养,岛内担忧“冻油价”加剧能源困局

环球网资讯 浏览 505

图多尔:虽输给皇马但球队有战斗精神,将努力去赢得每一场比赛

懂球帝 浏览 2639

零跑销量相当于小米与理想之和——属于老实人的胜利

DearAuto 浏览 2386

部分苹果 iPhone 17 Pro/Max 用户反馈机身褪色

IT之家 浏览 2735

马斯克宣布重启特斯拉Dojo 3超级计算机项目

不看车bukanche 浏览 1578

美前驻华大使不装了:凭啥和中国组G2划"势力范围"

观察者网 浏览 2888

245万的房子被中介私自标价170万挂牌 浙江业主怒了

FM93浙江交通之声 浏览 8695
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1