关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2455人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电的决胜时刻到了?换电、增程的生存空间还剩多少?

汽车总站网 浏览 1847

王中磊夫妇转战短视频,影视一哥到底怎么了?

BT财经 浏览 2506

看完这些上镜穿搭,国庆“美美出片”不费力

黎贝卡的异想世界 浏览 5619

年底是购车黄金期吗?看懂购置税博弈再下订不迟!

百姓评车 浏览 3639

AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼

新智元 浏览 3782

这个十一假期,打败酒店行业的是帐篷?

BT财经 浏览 3820

机器人,又杀出了第一股

投资家 浏览 3103

埃里克:对上赛季4-3赢皇马印象最深;弗里克总会激励球队

懂球帝 浏览 2668

潮汕三兄弟造“电驴”,9个月狂揽148亿

雷达财经 浏览 2424

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 3038

双十一特惠5折,双厨狂喜:智本社X财新

智本社 浏览 3474

高市早苗称想去参拜靖国神社 专家:欲获反华势力支持

环球网资讯 浏览 33782

马年壁纸送上,祝大家新年快乐,马上发财!

黎贝卡的异想世界 浏览 2077

高效训练新标杆!华人开源原生VLM-NEO,以少数据追平顶级模型

DeepTech深科技 浏览 3790

文旅上市潮,进入Next Level

斑马消费 浏览 3496

闫学晶品牌终止合作账号被禁 老底全翻出来爆炒

小娱乐悠悠 浏览 2637

不再有任何限制措施!微软:所有受支持设备都能升Win11 25H2了

快科技 浏览 3860

未来四川舰、福建舰如何打配合 专家解读

环球网资讯 浏览 3296

50+的女性,大衣、直筒裤、皮草这么穿,冬天保暖显瘦两不误

静儿时尚达人 浏览 2011

50+女性秋季穿搭新思路:告别卫衣,这4类上衣让你显嫩又有质感

静儿时尚达人 浏览 3553

造车新势力,重要时刻!

中国基金报 浏览 2717
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1