关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2531人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

汽车图谱⑳|新能源车迎最强“金九” 新势力头部月销达4万量级

贝壳财经 浏览 2818

特朗普呼吁立即停火 遭俄方坚决驳斥

财联社 浏览 2752

泽连斯基称乌美代表团将于本周晚些时候举行会谈

国际在线 浏览 2135

还能复活?某上海新势力公司宣布预重整

汽车工程师 浏览 1776

马克龙不加入和平委员会 特朗普:加征关税他就会加入

界面新闻 浏览 10964

还是他,太敢说了!果然有些车企,只是把激光雷达卖给你,当摆设

小李车评李建红 浏览 1927

东体:有其他中超队也对加布感兴趣,球员已到上海将回归海港

懂球帝 浏览 1365

罗志恒:三季度经济增速为何放缓?四季度经济前景如何?

首席经济学家论坛 浏览 2706

10.58 万!零跑造了一台「红米 YU7」

极客公园 浏览 2506

可能被“没收”一半股权,谷歌创始人逃离硅谷

字母榜 浏览 1651

王浩然三分绝杀,深圳95-92险胜山东,克里斯空砍30分

懂球帝 浏览 1955

拉什福德社媒鼓励球队:这是马拉松不是短跑,我们会继续战斗

懂球帝 浏览 2571

国家出手规范汽车价格!买车将更透明?

优视汽车 浏览 1958

焕然“E”新!近六万亿市场,大变样!

券商中国 浏览 1869

对话钦培吉:77岁的莲花,不做六边形战士

网易汽车 浏览 3223

中国社会科学院发布14项冷门绝学

经济观察报 浏览 3387

女主播被伪装的炸弹包裹炸伤:拿起看了一眼就爆炸了

极目新闻 浏览 7032

伊朗最高领袖顾问:特朗普理应担心有更多美国人伤亡

环球网资讯 浏览 38805

特朗普:若俄乌冲突无法解决 可能会供乌“战斧”

界面新闻 浏览 2767

千匹V8越野新豪华 捷尼赛思X Scorpio Concept

鳯眼观车 浏览 980

普京:“海燕”核动力巡航导弹完成“决定性试验”

极目新闻 浏览 2628
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1