关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2468人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉全面下架Model Y现车

电动知家 浏览 1634

罗晋唐嫣婚变进入倒计时!?

八卦疯叔 浏览 3615

慕尼黑车展折射中欧车企博弈

盖世汽车 浏览 4532

高市成日本史上首位女首相 石破茂曾抱怨当首相太累

鲁中晨报 浏览 8835

又一黑马大剧《表妹万福》来袭,宋祖儿撒娇追夫

动物奇奇怪怪 浏览 3747

萨莫拉诺:巴萨必须引导好亚马尔,从没听过梅西说皇马偷窃

懂球帝 浏览 3365

泰晤士:主场不敌西汉姆联,热刺正在考虑解雇主帅弗兰克

懂球帝 浏览 2565

万斯一句话让印度裔美国人炸锅 遭铺天盖地批评后回应

鲁中晨报 浏览 8812

美教授说大实话:特朗普对委动手背后 石油优先于民主

澎湃新闻 浏览 10098

美国禁止本国个人或实体向伊朗缴纳霍尔木兹通行费

财联社 浏览 32062

调查高通,开辟第二战场

博闻财经 浏览 3767

阿尔巴:对我帮助最关键的是埃梅里;我心中梅西就是历史最佳

懂球帝 浏览 3636

军报评何卫东、苗华等被开除党籍军籍:没有"铁帽子王"

北京日报客户端 浏览 9810

美澳关键矿产协议被解读为旨在"对抗中国" 外交部回应

澎湃新闻 浏览 7918

无止境,梅西常规赛28场贡献29球16助攻

懂球帝 浏览 3650

金正恩连续八次深夜阅兵 "大杀器"亮相

中国新闻周刊 浏览 3917

“棋子部署就位” 美国为何执意搅动加勒比海

上观新闻 浏览 3300

丹麦议员:我从没想过会站在美国使馆前示威

环球网资讯 浏览 6892

2026第一部「神」剧,诞生了

独立鱼 浏览 2118

跟队:萨尔可代表切尔西出战英联杯,但今晚不太可能出场

懂球帝 浏览 2485

蔚来艰难求盈利

北京商报 浏览 3129
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1