关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2693人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

45岁董洁北京定居,自己洗衣做饭很勤劳

无处不风景love 浏览 3394

普京:美供乌"战斧"将引发局势升级 但不会改变战场局势

环球网资讯 浏览 3759

宁波方正携手山东未来机器人,聚焦深海机器人业务

财闻 浏览 3663

张柏芝不再隐瞒,三胎生父早有答案?

石场阿鑫 浏览 2866

黄蜂24记三分133-126老鹰,鲍尔28+13,杰伦约翰逊43+11+9,特雷杨复出8+10

懂球帝 浏览 3025

防晒专场|| 几十块到手,回购一年多才来推荐

黎贝卡的异想世界 浏览 1055

张杰院士:三步走,2045建成上海首个聚变商业电站

澎湃新闻 浏览 4588

四个月内两高管遭留置 富森美称与上市公司无关

中国经营报 浏览 3268

蔚来乐道L60马到成功版上市:专属主题豪华内饰、车机,21.89万元

IT之家 浏览 2557

稳居无创产检检测赛道第二,双三类证在手,安诺优达三度闯关港股|港E声

时代周报 浏览 827

44岁李小璐参加公开活动!怼脸拍真实状态曝光,网友态度两极分化

萌神木木 浏览 3707

王健林限高措施已取消

YOUNG财经 浏览 4147

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

LinkFashion 浏览 2511

拒绝悬浮!6部扎心又治愈的“都市家庭剧”

木木汐影视剪辑 浏览 2655

美军新锐舰队为应对中国大举集结 集结地却远在夏威夷

枢密院十号 浏览 8083

新版《聊斋》杀青,六个单元主演全亮相,林允、宋祖儿倾力加盟

最爱酷影视 浏览 4492

全球首个海上千方 PEM 槽及制氢系统的全功率测试启动

IT之家 浏览 3564

美媒:以总理计划说服特朗普帮忙打伊朗

北京日报 浏览 3051

大量iPhone 17系列新机无法激活 苹果客服回应

界面新闻 浏览 8545

那些开口谈「性」的女性,决定不忍了

她刊 浏览 220

联合国秘书长敦促黎以冲突各方重返谈判桌

国际在线 浏览 1608
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1