关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2465人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

陈乔恩带老公和父母聚餐,Alan负责拍照

黄谋仕 浏览 2723

秋天穿衣真的一点都不难!从这些穿搭中收获灵感,舒适又耐看

静儿时尚达人 浏览 3352

深蓝汽车房楠:四载深耕、技术破局、全球化竞争

网易汽车 浏览 514

2025 年最强太阳耀斑爆发,引发非洲和欧洲多地无线电中断

IT之家 浏览 3391

宝马车商场停8101小时费用16900元 车主至今未开走

红星新闻 浏览 100165

杨紫新剧邀林志玲演上海名媛,两人11年前亲吻

小邵说剧 浏览 2563

NYU研究揭示:模型宽度与能力非线性相关

科技行者 浏览 3555

售35.98万元起 第二代腾势D9正式上市

网易汽车 浏览 501

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 3721

股份行AIC扩容至三家

北京商报 浏览 3335

美联储新主席是鹰是鸽

北京商报 浏览 2447

美媒列29岁的阿贾生涯荣誉:3次MVP&DPOY 2次总冠军&7次全明星

直播吧 浏览 3660

厦门翔安:侨商越海疆 展翼共翱翔——一场以侨为桥招商大会背后的千亿机遇

中国商报 浏览 2560

李在明访华签下3亿大单祭拜抗日英雄 转头突然宣布访日

博览历史 浏览 7820

普京再表态:俄罗斯不考虑重返G8,这与乌克兰局势无关

环球网资讯 浏览 3108

场内嬉笑,场外怒骂,《喜人奇葩说》第一季来了

时尚COSMO 浏览 3529

王家卫评论区沦陷!跟秦雯调情还曾让女配音员舔手,滤镜碎了一地

萌神木木 浏览 3549

外卖小哥蹊跷失踪22天:凌晨独自到水库 现场找到电动车

极目新闻 浏览 3768

美媒:报告称,东南亚成美国电子垃圾倾倒场

环球网资讯 浏览 3608

E句话| 路行退出《再见爱人》?

仙女事件簿 浏览 3373

这个「疯批」星二代,撕碎了娱乐圈的滤镜

独立鱼 浏览 2476
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1