关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1658人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

带病出战,李昊发着烧踢满了U23国足与泰国U23的比赛

懂球帝 浏览 1648

霸王茶姬创始人维权案将于3月开庭,公司回应:为反击此前涉婚姻、创业的诸多谣言

红星资本局 浏览 1595

许家印侄子许火健豪宅被法拍,起拍价4400万元,配有5个洗手间

红星资本局 浏览 1608

你从托马斯·穆勒身上吸取教训了吗?

绿茵情报局 浏览 1643

30.98万起交个朋友!2026款小鹏X9纯电版首搭第二代VLA上市

网易汽车 浏览 867

女生晒春运"出国回家"攻略:连飞俄两地再坐船回黑龙江

上游新闻 浏览 21141

信达生物与武田制药达成全球战略合作,交易额最高可达114亿美元,股价收跌近2%

红星资本局 浏览 2650

2026 春节档终极 PK!沈腾周星驰二次交手

第一娱记 浏览 1650

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者 浏览 2679

报道称美方将启动关键矿产储备计划 中方回应

财联社 浏览 5013

两种容量、最高纯电续航超320公里,极氪8X电池信息揭晓

IT之家 浏览 1682

白银LOF变成了一种分级B

远川聊资管 浏览 1378

李平康:贺一然加盟泰山基本差不多了,玄智健基本不可能了

懂球帝 浏览 1481

中国海警舰艇编队在钓鱼岛巡航

界面新闻 浏览 1983

飞天茅台批发价大涨,茅台控量措施会确立白酒行业的价格拐点吗?

郭施亮 浏览 1966

问界M6官图首发 以年轻化设计叩击25-30万级市场

网易汽车 浏览 1404

何以“破卷”?光伏经历至暗时刻!

飞鲸投研 浏览 1937

4天的沉默印证游本昌“真实人品”

娱乐圈笔娱君 浏览 2510

深圳“AI+政务”方案重磅发布:以后办业务,一句话的事!

南方都市报 浏览 805

63.3度电池+60L油箱 小鹏X9增程版续航1602公里

网易汽车 浏览 2728

中国观众认定的烂片,北美观众当成宝,首周末破4.3亿夺全球冠军

靠谱电影君 浏览 2830
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1