关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11376人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

月薪6万,哪些AI岗位在抢人?

深燃 浏览 16416

日媒:日本高端外国人才66%来自中国 远超印韩

环球网资讯 浏览 19355

衣品很好的中年女人,今冬都认准这三款服装,简单百搭也不过时

Yuki时尚酱 浏览 13319

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了

量子位 浏览 12226

快讯!外媒:拜登发声明,称在澳加荷等国支持下,美英对胡塞武装“成功打击”

环球网资讯 浏览 12598

「以演聚力·链动共生」文旅商体展融合专场私董会成功举办!| 2025文创新势力超级私董会

第一财经商业数据中心 浏览 639

新能源汽车第一城宣布:最高补贴8000元

21财闻汇 浏览 10994

香港法院作历史性判决 许家印家族信托"防火墙"被击穿

经理人杂志 浏览 13719

《狂飙》安长林在韩国首尔现身 为人随和十分接地气

巷子娱事 浏览 19529

俄乌双方表示击落对方多架无人机

海外网 浏览 14402

2名以方被扣押人员失联 卡桑旅要求以军暂停空袭24小时

极目新闻 浏览 1503

美泄密文件爆新料 北约被指在乌克兰部署特种部队

环球网资讯 浏览 18863

王诗龄一身穿搭超5万将返回伦敦 李湘王岳伦疑复婚

盖饭娱乐官方号 浏览 19400

TVB明星待遇:梁朝伟化妆要排队,视帝不能迟到,对比内娱太讽刺

文艺圈娱乐号 浏览 12981

Shams:勇士球员已经公开、私下表达了对球队现状的沮丧情绪

懂球帝 浏览 13077

写字楼大量空置成欧美“定时炸弹”,美媒:像贯穿全球经济的黑暗裂缝

环球网资讯 浏览 15667

做一个穿T恤有态度的女人

LinkFashion 浏览 19582

4年1亿也能接受!曝湖人愿匹配任何里夫斯报价:为何仍准备替代者

罗说NBA 浏览 15737

林俊杰疑似回应恋情:无需多言

粵語经典歌單 浏览 373

乌“反腐之火”烧到防长?俄媒:泽连斯基两难

海外网 浏览 14510

B站掀桌子了

虎嗅APP 浏览 15708
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1