关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1466人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

哈登:我以前从未如此不顺但我仍充满信心,这是对我们的考验

懂球帝 浏览 2232

苹果新手机开售即破发 砍单到几乎停产

21世纪经济报道 浏览 7165

小米汽车直播间遭网暴,仅剩一家门店直播,雷军抖音账号半个月掉粉30万

红星资本局 浏览 2737

"明珠"概念首次落地 荣威M7 DMH上市限时8.58万起

网易汽车 浏览 3420

秋到没边的氛围感美甲,一眼心动

时尚COSMO 浏览 2641

加盟米兰至今只替补出场1次,斯基拉:奥多古可能在冬窗离队

懂球帝 浏览 2501

智元机器人回应赴港上市传闻:不实消息

财联社 浏览 2810

酿酒入列历史经典产业,郎酒的“慢功夫”见真章

征探财经 浏览 2512

美媒补刀:高市早苗挑衅中国 日本承受不起

澎湃新闻 浏览 13782

牛弹琴:2025年最后1个月大戏上演 印度迎最重要客人

北京日报客户端 浏览 34094

98版沙僧刘大刚去世,最后露面曝光

科学发掘 浏览 2413

不变应万变!曼城连续3场首发不变,为瓜帅执教以来第三次

直播吧 浏览 3382

福建舰入列消息刷屏 美媒对其达到的技术高度表示赞叹

环球网资讯 浏览 7304

王励勤出任乒羽中心副主任

体坛周报 浏览 2158

81岁“中国刻蚀机之父”拟减持:已从外籍恢复为中国籍,为办理税务需要

红星资本局 浏览 1712

《一路繁花2》要封神?5位综艺强者登场,预告连刷4遍不过瘾

娱乐圈笔娱君 浏览 2760

普京签署法律修订兵役法:征兵工作将全年不间断进行

界面新闻 浏览 7121

一杯酸奶,估值1422亿

投中网 浏览 2533

闫学晶首现身再传噩耗,这回真洗不白了

草莓解说体育 浏览 1613

美军2架F-18战机飞入委内瑞拉领空 停留至少40分钟

界面新闻 浏览 2192

郑丽文要让国民党"羊群变狮群":不是反咬一口而已

海峡导报社 浏览 8539
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1