关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11379人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

美联储降息、买短债，鲍威尔偏鸽，美股、短期美债、黄金涨，美元跌，比特币震荡

华尔街见闻官方浏览 86

中超第27轮跑动距离榜：马德鲁加12689米居首，赛季第2次登顶

懂球帝浏览 926

程晓玥曝产后身材妊娠线赘肉颈纹全来

娱絮浏览 18646

精彩推荐

中国车在俄份额跌破50%，新一轮洗牌开启

汽车公社浏览 91

特朗普：俄乌应按当前战线划界停火、各自撤兵

新华社浏览 946

过了四十岁的女人，冬季穿搭一定要注意这三点，搭配得当才显气质

Yuki时尚酱浏览 13490

学会这些穿衣窍门变好看真的很简单

虎哥说衣不二浏览 17029

用她和朱珠比较，不太公平？

江湖人称艾掌门浏览 639

传祺向往S9上市，四驱+华为全家桶+宁德电池

SUV大百科浏览 1610

俄发视频展示缴获的美战车美称无法证实

环球网资讯浏览 16010

NBA官方最新MVP榜：约基奇连续9周第一剑指3连庄字母哥次席

醉卧浮生的体育世界浏览 19379

朝鲜智库：目前半岛紧张局势不亚于朝鲜战争爆发前夕

环球网资讯浏览 86543

王暖暖花6年才离掉婚男方母亲曾带女子探监和他相亲

新京报浏览 1075

美媒独家爆料：“北溪”管道爆炸调查人员面临来自波兰政府的阻力

环球网资讯浏览 12628

罗马诺：热苏斯已经回归参加阿森纳的训练，膝盖伤势并不严重

直播吧浏览 12572

世体：皇马拒绝让女超杯在迈阿密举行，女足俱乐部都感到不满

懂球帝浏览 1042

劲爆！OpenAI CEO Altman 结婚了。。。和程序员 Ollie（男）

云头条浏览 12521

比起辣妹风，早秋这样穿的女生才是高段位吧！

Yuki女人故事浏览 1971

你看到的不是奔驰纯电CLA，而是汽车的下一个20年

1号车盟浏览 269

王宝强演技封神之作《hello，树先生》：世界从不在乎小人物的命运悲剧

趣看热点浏览 26750

信达生物与武田制药达成全球战略合作，交易额最高可达114亿美元，股价收跌近2%

红星资本局浏览 832

哈梅内伊提出伊美谈判条件近期不会考虑美国合作请求

环球网资讯浏览 702

才发现“打底裤”居然这么时髦！掌握这3点精髓，谁穿谁好看

静儿时尚达人浏览 13222

官方披露凉山州社保系统窝案：多人在养老险上动手脚

澎湃新闻浏览 70415

X

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-1