关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1690人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

货拉拉跑腿骑手取走万元苹果手机后失联 手机店主发声

红星新闻 浏览 7868

Nuralogix智能镜亮相CES,可看脸提供“长寿评分”

IT之家 浏览 1756

冲刺“开门红” 有银行理财公司0费率抢市场

中国商报 浏览 1618

中方接连被美国暗中"做局" 两个国家几乎同时对华出手

头条爆料007 浏览 6203

东南大学突破:AI学会情境化拒绝能力

科技行者 浏览 2774

财政负担持续累积,“节油意识”难以培养,岛内担忧“冻油价”加剧能源困局

环球网资讯 浏览 505

伊朗防长:美国"以武促和"实为强制屈服 各国不会接受

极目新闻 浏览 2882

NBA碎碎念合集(2)

静易墨 浏览 2602

看完翁青雅的“车祸现场”,大家不再骂朱丹了

宛沐 浏览 2395

美对委军事打击造成至少40人死亡

界面新闻 浏览 1697

鲁媒谈准入:新赛季会带给更多球队机遇,想获红利需守住阵地

懂球帝 浏览 2049

再现巨额压单!A股跳水,官媒给“题材炒作”降温,商业航天跌停潮

看财经show 浏览 1498

杨瀚森明日再战G联赛!开拓者官宣两大活动:送玻璃杯+售马年球衣

罗说NBA 浏览 957

2025年双11来了!京东提前至10月9日开启:满300元减50元 活动玩法出炉

快科技 浏览 3279

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

网易汽车 浏览 1638

万元损失仅补两千?国投瑞银的补偿,没能让大额投资者“和解”

拾盐士 浏览 882

泽连斯基:愿与特朗普和普京会面 但不去莫斯科

极目新闻 浏览 3487

泰国外长:泰柬将于12月24日举行会谈 讨论停火细节

财联社 浏览 1854

媒体:自家老牌车企落后中美 欧盟恐对中国车厂下手

澎湃新闻 浏览 9770

预售35万起 小鹏X9增程版终结MPV续航焦虑

网易汽车 浏览 2507

宝马集团失守中国市场:2025年全球销量微增0.5%,中国销量下滑12.5%

红星资本局 浏览 1668
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1