关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者784人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

迪丽热巴“扛剧女王”人设崩塌?

孟一宜 浏览 343

林心如带女儿拍广告惹争议,为何被骂又当又立?

传媒一班 浏览 16576

汪苏泷被亲后毫无波澜并喝了口水,汪苏泷新恋情?

趣看热点 浏览 28115

理查利森:穿上皇马球衣是所有球员的梦想 我要证明热刺为何签我

直播吧 浏览 16373

特朗普被曝已打新冠疫苗,今年1月时就悄悄完成了接种

趣看热点 浏览 272949

美联储官员还谨慎但债市更乐观:欢呼加息周期结束、迎接明年初降息

华尔街见闻官方 浏览 14671

光伏普遍亏损!TCL中环业绩跳水,存货损失何时休?

星空财富bj 浏览 11265

14岁休学少女进拓展营后死亡 曾哭喊"妈妈我不想死"

新京报 浏览 34189

标配功能很牛 雪佛兰发布全新一代探界者

网易汽车 浏览 12486

魏晨一家三口合体,妻子抱着儿子看他演唱会

柠檬有娱乐 浏览 585

车崇健被嘉宾集体吐槽!Papi直言他听不懂人话,网友喊话别复合了

萌神木木 浏览 759

楼市,又一个重大隐患……

杨国英观察 浏览 10713

赵丽颖直播太实诚,被问儿子暖还是羊绒暖,赵丽颖果断选择儿子

扒虾侃娱 浏览 1021

年轻创意总监们为何频频离职?

精奢商业观察 浏览 16611

跟队:拜仁内部不会轻易谈论让伦纳特-卡尔踢世界杯的话题

懂球帝 浏览 893

特朗普自首后被收押,已拍摄监狱大头照

观察者网 浏览 14474

国庆长假,基层的你休了几天?

识局 浏览 984

伊朗外长:美国要求伊朗与黎真主党沟通

澎湃新闻 浏览 12536

同样是悼念亡妻,把具俊晔和辛柏青放一起比较,差别怎么这么大!

娱乐圈笔娱君 浏览 862

中资银行,两大突发!

券商中国 浏览 11136

老而弥坚,追梦:我还能再打4-5年,新赛季我仍充满动力

懂球帝 浏览 904
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1