关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11376人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

拉波尔塔：西甲批准了未来两年的可行性计划，我们可注册重要球员

直播吧浏览 16527

《X战警》42岁男星阑尾癌去世！最后更新停留在1年前，病危想复出

文艺圈娱乐号浏览 13260

美联储1月会议最值得关注的大事:何时开始放缓＂缩表＂？

Wind万得浏览 12767

精彩推荐

月薪6万，哪些AI岗位在抢人？

深燃浏览 16416

日媒：日本高端外国人才66%来自中国远超印韩

环球网资讯浏览 19355

衣品很好的中年女人，今冬都认准这三款服装，简单百搭也不过时

Yuki时尚酱浏览 13319

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了

量子位浏览 12226

快讯！外媒：拜登发声明，称在澳加荷等国支持下，美英对胡塞武装“成功打击”

环球网资讯浏览 12598

「以演聚力·链动共生」文旅商体展融合专场私董会成功举办！| 2025文创新势力超级私董会

第一财经商业数据中心浏览 639

新能源汽车第一城宣布：最高补贴8000元

21财闻汇浏览 10994

香港法院作历史性判决许家印家族信托＂防火墙＂被击穿

经理人杂志浏览 13719

《狂飙》安长林在韩国首尔现身为人随和十分接地气

巷子娱事浏览 19529

俄乌双方表示击落对方多架无人机

海外网浏览 14402

2名以方被扣押人员失联卡桑旅要求以军暂停空袭24小时

极目新闻浏览 1503

美泄密文件爆新料北约被指在乌克兰部署特种部队

环球网资讯浏览 18863

王诗龄一身穿搭超5万将返回伦敦李湘王岳伦疑复婚

盖饭娱乐官方号浏览 19400

TVB明星待遇：梁朝伟化妆要排队，视帝不能迟到，对比内娱太讽刺

文艺圈娱乐号浏览 12981

Shams：勇士球员已经公开、私下表达了对球队现状的沮丧情绪

懂球帝浏览 13077

写字楼大量空置成欧美“定时炸弹”，美媒：像贯穿全球经济的黑暗裂缝

环球网资讯浏览 15667

做一个穿T恤有态度的女人

LinkFashion 浏览 19582

4年1亿也能接受！曝湖人愿匹配任何里夫斯报价：为何仍准备替代者

罗说NBA 浏览 15737

林俊杰疑似回应恋情：无需多言

粵語经典歌單浏览 373

乌“反腐之火”烧到防长？俄媒：泽连斯基两难

海外网浏览 14510

B站掀桌子了

虎嗅APP 浏览 15708

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-1