关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1686人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

两中国游客穿泳衣失联 失联女生对父母说是与发小出游

红星新闻 浏览 18696

今年冬天最流行搭配:裤子+靴子,高级又时髦!

LinkFashion 浏览 2236

早有预兆!浙江老板遭刑事强制,一个多月前已有小道消息

壹只灰鸽子 浏览 2692

果壳直击CES:具身智能下班时刻

果壳 浏览 1637

全网最后一批躺赚博主,也被AI挤兑失业了

新周刊 浏览 2861

恩里克:我的球员今天表现得很出色,不过在结果上略有遗憾

懂球帝 浏览 2090

全球股市最强风口,彻底拦不住了?

财经锐眼 浏览 1408

威刚展示SD 8.0标准SDXC存储卡:顺序读取1.6 GB/s

IT之家 浏览 1746

3天破24.3亿中美观众不买账,《哪吒2》年冠稳了

靠谱电影君 浏览 1838

我永远不会买黄金,更不会投资黄金!

浏览 24870

创维抄袭格力,为何低级得如此赤裸裸?

正经社 浏览 1600

苹果欲推首款低价Mac,定价远低于1000美元,挑战微软与Chromebook

华尔街见闻官方 浏览 2479

快手全员发开工红包:正式员工366元

三言科技 浏览 966

双雄对决,最豪华精彩的英国戏剧现场上演!

幕味儿 浏览 2574

斯基拉:吉达联合正尝试续约38岁的本泽马,已开出两年新合同

懂球帝 浏览 1615

哈梅内伊遇袭身亡 被指已指定暂代最高领袖责任人选

新民周刊 浏览 38856

"吉林一号"发布多张台湾岛高清卫星影像 屋顶细节可见

北京日报客户端 浏览 7239

这些都是普通人适合的穿搭!多穿卫衣和半身裙,舒适又耐看

静儿时尚达人 浏览 2439

伊朗情报部长:伊成功渗透以色列核研究设施

每日经济新闻 浏览 3255

4大最新信号!出手“黄金坑”的机会来了?

小白读财经 浏览 2768

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

LinkFashion 浏览 1549
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1