关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11379人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国车在俄份额跌破50%,新一轮洗牌开启

汽车公社 浏览 91

特朗普:俄乌应按当前战线划界停火、各自撤兵

新华社 浏览 946

过了四十岁的女人,冬季穿搭一定要注意这三点,搭配得当才显气质

Yuki时尚酱 浏览 13490

学会这些穿衣窍门 变好看真的很简单

虎哥说衣不二 浏览 17029

用她和朱珠比较,不太公平?

江湖人称艾掌门 浏览 639

传祺向往S9上市,四驱+华为全家桶+宁德电池

SUV大百科 浏览 1610

俄发视频展示缴获的美战车 美称无法证实

环球网资讯 浏览 16010

NBA官方最新MVP榜:约基奇连续9周第一剑指3连庄 字母哥次席

醉卧浮生的体育世界 浏览 19379

朝鲜智库:目前半岛紧张局势不亚于朝鲜战争爆发前夕

环球网资讯 浏览 86543

王暖暖花6年才离掉婚 男方母亲曾带女子探监和他相亲

新京报 浏览 1075

美媒独家爆料:“北溪”管道爆炸调查人员面临来自波兰政府的阻力

环球网资讯 浏览 12628

罗马诺:热苏斯已经回归参加阿森纳的训练,膝盖伤势并不严重

直播吧 浏览 12572

世体:皇马拒绝让女超杯在迈阿密举行,女足俱乐部都感到不满

懂球帝 浏览 1042

劲爆!OpenAI CEO Altman 结婚了。。。和程序员 Ollie(男)

云头条 浏览 12521

比起辣妹风,早秋这样穿的女生才是高段位吧!

Yuki女人故事 浏览 1971

你看到的不是奔驰纯电CLA,而是汽车的下一个20年

1号车盟 浏览 269

王宝强演技封神之作《hello,树先生》:世界从不在乎小人物的命运悲剧

趣看热点 浏览 26750

信达生物与武田制药达成全球战略合作,交易额最高可达114亿美元,股价收跌近2%

红星资本局 浏览 832

哈梅内伊提出伊美谈判条件 近期不会考虑美国合作请求

环球网资讯 浏览 702

才发现“打底裤”居然这么时髦!掌握这3点精髓,谁穿谁好看

静儿时尚达人 浏览 13222

官方披露凉山州社保系统窝案:多人在养老险上动手脚

澎湃新闻 浏览 70415
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1