关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1513人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

助力识别、延缓或逆转老年疾病,全新“自然奖项”问世

上观新闻 浏览 3291

华为智慧屏新品MateTV Max今日预售,110英寸64999元

IT之家 浏览 2260

一加 15 /Ace 6 适配《金铲铲之战》原生 165 超高帧模式

IT之家 浏览 2659

苗圩:保障安全的前提下,科学有序推进人工智能技术落地

红星资本局 浏览 2852

小米汽车又一重要专利公布!

电动知家 浏览 2293

记者:原梅州客家主帅里斯蒂奇将接任李霄鹏,执教青岛海牛

懂球帝 浏览 2003

美国43岁母亲在学校舞会拐走女儿14岁男友 还和他生子

潇湘晨报 浏览 8235

韩剧女神,被吐槽“断崖式衰老”?

寻艺 浏览 1488

华为登顶,吃了谁的蛋糕?

智东西 浏览 1604

高德拿了谷歌剧本,餐饮商家想当主角

蓝鲸新闻 浏览 3229

拉莫斯:虽然浙江队实力很强,但我们最近的火力也很强盛

懂球帝 浏览 2616

特朗普:空管员不返岗就扣薪 建议停摆期未请假者奖钱

鲁中晨报 浏览 31009

舒淇现身亲揭《女孩》没报金马奖原因

ETtoday星光云 浏览 2611

181亿医疗信息化龙头掌舵人周炜,行贿一审被判后辞去董事长

雷达财经 浏览 2496

天价索赔后,欣旺达还能稳当“老六”吗?

财经无忌 浏览 1441

CES2026:吉利将发布最新辅助驾驶等全域AI技术成果

网易汽车 浏览 1851

何超琼近况曝光,生图皮包骨大小眼,西装裤松垮

张发林 浏览 3296

孤本奉献,世界音像遗产日今日特别放送!❤️

幕味儿 浏览 2673

发布多模态交互开发套件,发力硬件抢占入口!阿里云已兵分两条路布局AI手机

时代财经 浏览 1611

苏州一企业愿无偿为嫣然医院提供场地 负责人:将详谈

潇湘晨报 浏览 5489

今年秋冬最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 2548
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1