关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3490人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

演艺圈中最没有“父子相”的几对艺人父子

有品设计 浏览 3251

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 4426

大动作调仓!机构开年疯狂扫货这些板块,而火爆的芯片、半导体ETF竟被抛售

每经牛眼 浏览 2678

终结3连败!骑士大胜双杀步行者 米切尔43分末节16分

醉卧浮生 浏览 3137

特朗普称俄为"纸老虎" 普京回应

央视新闻客户端 浏览 2833

春晚阵容曝光!十年来最强的演出阵容

阿纂看事 浏览 2451

综合补贴8.78万元起 星光730尊享型正式上市

网易汽车 浏览 488

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 3562

监管部门再出重拳“反内卷”:严禁车企不正当价格竞争,比亚迪小鹏北汽等表态

北京商报 浏览 3016

9个月出口571万辆车 中国汽车远征军杀出新血路

科学知识点秀 浏览 3488

协议中加入"毒丸"条款 美国与印尼的贸易协议面临破裂

第一财经资讯 浏览 19847

记忆大模型MemoraX AI完成千万美金种子轮融资,L2F光源创业者基金、钟鼎资本联合领投 | 融资速递

钛媒体APP 浏览 526

首款中国超跑,比亚迪仰望 U9 将入驻《GT 赛车 7》

IT之家 浏览 3641

犯罪团伙大胆却“业余”,珠宝黑市隐蔽且暴利,FBI前探员拆解卢浮宫劫案

环球网资讯 浏览 3733

王楚钦退赛:突然背部不适 一度不太能动得了

北京日报 浏览 8085

周末两大利空!科技股被一致看空,国常会、证监会重磅

看财经show 浏览 3461

一千多人牺牲结局,无法改写,但于和伟临刑前一个动作,升华全剧

皮皮电影 浏览 3654

ESPN:德容已与巴萨就续约达成协议,他的薪水将降低

懂球帝 浏览 3660

9月中级车市场洗牌,新能源新兵为何也栽了跟头?

百姓评车 浏览 3752

伊朗外长:美封锁港口是战争行为

环球网资讯 浏览 32159

土拍市场延续“缩量提质”百强房企今年前两月拿地超950亿元

商业观察杂志社 浏览 2003
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1