关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3482人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国防部长董军出席第十二届北京香山论坛并作主旨发言

政知新媒体 浏览 4442

一年一度的秋装趋势,来了!

黎贝卡的异想世界 浏览 5707

俄三防部队司令遇袭身亡案调查结束 细节披露

每日经济新闻 浏览 3804

伊朗方面披露美军在伊南部海域兵力布防

新京报 浏览 2357

舞蹈与千年古镇碰撞 第二季新市古镇舞蹈艺术季启幕

国是直通车 浏览 3591

特斯拉撞树后打不开车门 5人被困燃烧的车内身亡

每日经济新闻 浏览 3528

2027年发布 新款路虎揽胜运动SV谍照曝光

车质网 浏览 2357

先锋来袭 丰田卡罗拉概念车新车图解

车质网 浏览 1952

以色列民众反对进攻加沙 民意与政府撕裂加剧

海外网 浏览 4306

明天会更一部灵异类电影,那就找几张鬼里鬼气的壁纸,大家收图

电影最TOP 浏览 2962

足总杯117年最大冷门!卫冕冠军首战出局,被业余球队淘汰

奥拜尔 浏览 2679

“东风Jeep”要来了?Jeep全球高层到访武汉

网易汽车 浏览 2989

曼联官方:召回小将惠特利,为北安普顿出场25次打进3球

懂球帝 浏览 2637

张家界荒野求生赛剩1名女选手:瘦得判若两人 称想吃肉

现代快报 浏览 9543

拉波尔塔:这场胜利来得正是时候;亚马尔一如既往地出色

懂球帝 浏览 3447

冰雪穿越理念 宾利添越Concept X官图发布

车质网 浏览 2475

中国人自己的敞篷跑车来了!腾势Z敞篷版曝光

优视汽车 浏览 2985

随着西班牙3-0 世界杯16强定14席 中国队对手确定 亚洲仅韩国出局

侃球熊弟 浏览 3734

卖了3199万元 德信集团董事长杭州豪宅被拍卖抵债

红星新闻 浏览 12258

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 3872

光伏巨头通威、隆基预亏近百亿,行业深度调整未见拐点

华尔街见闻官方 浏览 2631
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1