关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者777人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郑智化吐槽大陆机场,评论区沦陷

娱乐圈笔娱君 浏览 809

与大14岁男友结婚且双喜临门?黄心颖晒照吐心声

高能E蓓子 浏览 14714

最近《美人鱼2》补拍镜头完成,预计今年将选择合适的档期上映

趣看热点 浏览 26565

郑爽张恒借贷纠纷案二审开庭郑爽张恒目前最新情况

趣看热点 浏览 26615

刚刚,92岁的默多克,又双叒叕订婚了!

华商韬略 浏览 12214

香港这一夜,被笑不露齿的蒋勤勤惊艳,身材丰满有料艳压群芳

娱乐圈笔娱君 浏览 11933

认真生活的18个锦囊妙计:

黎贝卡的异想世界 浏览 2062

房产遇灾能获赔百万?“家财险”值得买吗?

环球网资讯 浏览 14628

卢浮宫一件被盗文物被发现已损毁 疑为欧仁妮皇后皇冠

极目新闻 浏览 5368

科利莫尔:热刺需要速度和活力,凯尔特人的古桥亨梧值得赌一把

直播吧 浏览 16485

马拉戈:意大利惨败瑞士像开玩笑 斯帕莱蒂感觉被场上球员背叛了

直播吧 浏览 11065

本赛季前5轮三支英超升班马共拿19分,比上赛季三队快一倍

直播吧 浏览 1650

越跌越买!科创主题ETF份额下半年增超400亿份

每日经济新闻 浏览 14481

专家:国防部长履新后首访选择俄罗斯 这具有重要意义

环球网资讯 浏览 110532

AI浪潮已至,重磅嘉宾云集,乌镇再启新汽车之问

AutoBusiness 浏览 635

抖音们的价值观强了,极端情绪就弱了

经济观察报 浏览 10604

高效输出!大瓦格纳半场8分钟5中4拿11分

直播吧 浏览 13282

香会智库报告偏颇指责中国 中国学者当场反驳

北京日报客户端 浏览 68211

媒体:王毅不点名回应布林肯 对中美关系说了重话

直新闻 浏览 81361

甜妹的日常怎么穿?从田曦薇这里找点灵感

瑞丽网 浏览 15768

自2020年帽子戏法次数榜:哈兰德12次居首,莱万10次&姆巴佩9次

直播吧 浏览 19157
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1