关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者783人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泫雅龙俊亨官宣恋情!两人8年前就常深夜喝酒

缘木不求娱 浏览 12647

合纵连横更进一步,本赛季双子星同参赛无一冠军旁落!

网球之家 浏览 726

公司创始人被指打断妻子七根肋骨 被刑事立案后取保

上游新闻 浏览 91680

当整容脸混进央视司法剧,撞上天然脸演员,简直是降维打击!

肆季娱乐 浏览 10630

梅开二度,姆伯莫当选与布莱顿一役曼联队内最佳球员

懂球帝 浏览 835

工信部副部长:我国家电、家具等100多个品类产量全球第一

IT之家 浏览 345

网曝谋女郎霸凌助理,让对方手洗内衣跪下穿鞋

盖饭娱乐官方号 浏览 19375

中国重点40城,九年间消失了多少企业?

财经十一人官方 浏览 19521

央视春晚美女主持王嘉宁结婚 老公长相曝光

盖饭娱乐官方号 浏览 16912

开年第一瓜!知名男星被曝欠钱不还,劈腿打人

不八卦会死星人 浏览 12458

竞逐AI内容,爱奇艺先出手了

连线Insight 浏览 876

美国1-1厄瓜多尔,恩纳-瓦伦西亚破门,巴洛贡扳平

懂球帝 浏览 1001

记者:佛罗伦萨球员不满基恩500万高薪,后者态度也存在问题

懂球帝 浏览 76

不想过年的年轻人,躲回工作中

刺猬公社 浏览 12178

演艺圈中最没有“父子相”的几对艺人父子

有品设计 浏览 831

买珠宝像买糖果,这位亚裔名媛因奢华挥霍走红

外滩TheBund 浏览 16999

2025款比亚迪海狮05 EV完全评价报告

车质网 浏览 832

马筱梅罕谈大S过去,撕碎S家仅剩的“体面”?

有趣的胡侃 浏览 715

费兰-托雷斯:我曾陷入无底深潭 若要战胜曼联就必须亡命奔跑

直播吧 浏览 19178

AGI for Science:关于科学未来的6个问题

知识分子 浏览 1494

丝袜称明年随心参赛无视强制参赛规则,高芙称女网更有趣更具悬念

网球之家 浏览 704
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1