关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者780人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

湖南省委下发通知 在全省开展解放思想大讨论

财联社 浏览 80981

这些"显眼包"直接盘活了初秋衣橱

《红秀GRAZIA》 浏览 14945

间谍入住海景民宿拍军港敏感画面 被民宿店主识破上报

央视新闻客户端 浏览 7251

互黑式宣发:赵丽颖、黄晓明互动

孟一宜 浏览 784

国庆"被弃高速"的小狗主人找来了 主人:不是故意丢弃

红星新闻 浏览 15820

今年冬天最流行的大衣“高阶穿搭”,太时髦了!

LinkFashion 浏览 382

《盛夏未来》发布新海报,张子枫吴磊花絮曝光影片将于8月13日七夕档全国上映

趣看热点 浏览 27464

美媒:特朗普的入驻 对困境中的TikTok来说是一次胜利

直新闻 浏览 67661

14岁王诗龄拍写真尽显壕气 穿12万裙子披波浪卷发

萌神木木 浏览 12833

贝莱林:温格视足球为艺术,阿尔特塔和他就如同一枚硬币的两面

直播吧 浏览 1622

经观社论|企业家精神奔涌不歇

经济观察报 浏览 12049

59岁蒋雯丽现状让人心酸,一代女神也落寞了?

洲洲影视娱评 浏览 628

肖荣基带肖思远的照片亮相九三阅兵

环球网资讯 浏览 1027

45岁林嘉欣变胖了,成了大码美女

素素娱乐 浏览 11921

闪电快讯|东风奕派eπ007+正式上市 限时焕新价13.99万元起

电厂 浏览 611

冬天的“销冠”,已被羽绒服预定

时尚COSMO 浏览 491

新能源购置税“末班车”,上还是不上?

浙江车网 浏览 686

人均25元的素食自助,排爆商场

餐饮老板内参 浏览 747

打服了!记者:当时觉得凯恩太贵不值当,现在我愿为他铺毛巾

直播吧 浏览 1676

俄安全局称击毙四名企图渗透到俄境内乌破坏人员

环球网资讯 浏览 14353

陈伟霆何穗官宣当爸妈!圈内仅5位明星送祝福,女方为爱放弃事业

萌神木木 浏览 952
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1