关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2477人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨紫胡歌“以命换命”,《生命树》到底讲了什么?

仙女事件簿 浏览 2357

赖清德求特朗普让中国大陆放弃对台用武 朱立伦怒批

海峡导报社 浏览 19093

谷歌推迟安卓设备上谷歌Assistant向Gemini的迁移计划

IT之家 浏览 2970

今年一定要拥有这件“爆火单品”,让你美出新高度

LinkFashion 浏览 2336

当女将军成为内娱偶像剧时尚单品,我们更怀念穆桂英

时尚COSMO 浏览 5797

登上热搜!王欣瑜激战阿尼西莫娃

网球之家 浏览 2575

卷首语|这届年轻人,全员渡劫奥德赛

时尚COSMO 浏览 320

汪涵老婆带82岁母亲拍照,透露从芒果离职原因

心静物娱 浏览 3096

2026年世界互联网大会亚太峰会下月在香港召开

财闻 浏览 1619

伊朗总统:袭击最高领袖 等同“发动全面战争”

每日经济新闻 浏览 2594

日在野党提议自卫队改名国防军 中方回应

北京青年报-北京头条 浏览 4304

300353,重大资产重组!明日复牌

中国基金报 浏览 3433

视频:福建舰夜泊军港 航母上亮起灯光

北京日报 浏览 2521

首艘美国船被罚之际 特朗普调2艘航母部署中国周边

现代小青青慕慕 浏览 7240

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 1807

将于北京车展首发 奕境旗下首款量产车路试谍照曝光

网易汽车 浏览 2612

半个娱乐圈为肖战包场,《得闲谨制》票房走俏,侯鸿亮鞠躬致谢

娱乐圈笔娱君 浏览 3081

鸿蒙智行鹭岛首家尚界专网用户中心开业

Report汽车 浏览 3494

CBA疯狂一夜:大胜+逆转!广东大翻盘 广厦从第1掉第3 附最新排名

侃球熊弟 浏览 2750

分子设计迎来AI新纪元:蒙特利尔大学让计算机成为"分子工程师"

科技行者 浏览 2646

没补贴、收购置税,新能源车好日子到头了?现实会打服“恨电派”

小李车评李建红 浏览 4321
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1