关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11361人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天气正好,和牛仔靴踏春去!

嘉人marieclaire 浏览 19426

成都锦里古街树木倾倒砸伤游客 目击者:树木是空心的

上游新闻 浏览 6690

知名港圈女神近况曝光 被指皮肤松弛显老态

港剧剧透社 浏览 19357

环球:中国防长访俄 西方媒体急着找出"非常规信号"

环球网资讯 浏览 116224

泰国拿到中国071登陆舰没几天 里里外外全拍给网友看了

沙盘上的战争 浏览 92620

一加 15 真机曝光,设计风格延续一加 13T

IT之家 浏览 1684

上海被"流放"江西乡镇小伙10个月后再就业:月薪仍上万

上游新闻 浏览 76060

11个月来首次进球,丹尼-英斯结束32场进球荒

懂球帝 浏览 11820

“靴靴你”雪地精灵杨超越

时尚COSMO 浏览 13465

他俩恋爱,国产爱情又“活”了

吐槽电影院 浏览 12449

布林肯回应瓦格纳"24小时哗变":还未看到最后一幕

澎湃新闻 浏览 15804

普里戈任抵达白俄 北约秘书长称已准备好防御威胁

新京报外事儿 浏览 15859

回到梦的起点?德里克-罗斯曾就读于孟菲斯大学

直播吧 浏览 15112

南加大团队揭秘:让AI做数学题更聪明的"长度感知"训练法

科技行者 浏览 767

林雪演戏被喂烂提子,被林雪笑死了被问到有没有想过减肥

趣看热点 浏览 28033

特朗普:目前不打算供乌“战斧”导弹

央视新闻客户端 浏览 937

AI大战打到太空!前脚H100入轨,TPU后脚上天,中国玩家笑而不语

量子位 浏览 718

乌军批准3千多名囚犯从军:他们希望以英雄的身份回家

澎湃新闻 浏览 64299

马斯克宣布首例人类大脑芯片植入,为什么是里程碑事件?

都市快报橙柿互动 浏览 12468

智己L6首次OTA升级 MOS3.0.0正式版推送

网易汽车 浏览 10724

为什么她们穿粉色很好看?

Yuki女人故事 浏览 195
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1