关闭广告

上海交大突破:AI精准学习人类审美偏好

科技行者3482人阅读


这项由上海交通大学、上海人工智能实验室、中国科学技术大学和复旦大学联合开展的研究发表于2025年10月,论文编号为arXiv:2510.01982v1。研究团队开发了一套名为G?RPO的全新技术框架,专门用于让AI绘画模型更好地理解和满足人类的审美偏好。

要理解这项研究的意义,我们可以把AI绘画过程想象成一个学习画画的学生。传统方法就像给学生一张完整的作品后说"画得好"或"画得不好",但学生并不知道具体哪一笔画得好,哪一笔需要改进。这种模糊的反馈让学习过程变得缓慢而低效。

研究团队发现了现有AI绘画训练方法的两个关键问题。第一个问题是"奖励信号稀疏",就好比一位厨师做菜时,只有等整道菜完成后才能品尝,无法在烹饪过程中及时调整火候和调料。第二个问题是"评估不够全面",类似于只从一个角度评判一幅画作,而忽视了从不同距离、不同光线下观看的效果。

针对这些挑战,研究团队提出了创新的"颗粒化GRPO"解决方案。这套方案包含两个核心技术:单步随机采样策略和多粒度优势集成模块。

单步随机采样策略的工作原理就像给绘画过程装上了"定点导航系统"

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

楼梯上!中场休息时的离奇受伤

绿茵情报局 浏览 2569

琼瑶女神摘下假牙,撕碎的是流量滤镜

大龄女一晓彤 浏览 3781

5分钟充满电!全球首款可量产全固态电池来了

21世纪经济报道 浏览 2737

欧盟一些成员国欲"另起炉灶" 绕开欧盟跟美国直接谈

澎湃新闻 浏览 19218

部分苹果 iPhone 17 Pro/Max 用户反馈机身褪色

IT之家 浏览 3710

被娱乐圈催熟的林妙可王诗龄!

八星人 浏览 2643

绿帽哥:切尔西就罗德里戈与皇马展开接触,计划冬窗完成交易

懂球帝 浏览 3390

中俄最后一刻没保住伊朗 制裁重启哈梅内伊政权危险了

文雅笔墨 浏览 37340

泽连斯基签署多项针对俄罗斯制裁令

国际在线 浏览 3732

徐彬:接到狼队电话以为诈骗 不想等25岁出去 邵佳一让我看淡金钱

我爱英超 浏览 2450

媒体:美作错误示范 未来突破"底线"的事或更频繁发生

新民晚报 浏览 9853

德雷森:穆西亚拉不会挤压卡尔出场时间,没准他俩能同时登场

懂球帝 浏览 2656

对话“死了么”App创始人:这几天付费人数翻了200倍;另有“活了么”App上线

红星资本局 浏览 2691

首次搭载Hi4-Z架构 全新坦克400上市售24.98万起

网易汽车 浏览 3458

美伊"极限拉扯"伊朗拒绝谈判 特朗普作出重大让步

上观新闻 浏览 32321

闫学晶风波终于落幕,6个男人惨遭牵连

青橘罐头 浏览 2441

10余年持续攻关,为长大隧道配一个智能“消防员”|2024上海市科学技术奖

上观新闻 浏览 2626

五粮液第三季度营收、净利润同比分别下降52.66%、65.62%

红星资本局 浏览 3667

金鸡奖成“照妖镜?

柠檬有娱乐 浏览 3383

一切为了销量、利润,消息称三星决定不提高Galaxy S26系列售价

IT之家 浏览 2865

新奥能源研究院院长刘敏胜:探索球形环氢硼聚变技术,开发商用聚变能源

红星新闻 浏览 3784
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1