关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11369人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伤愈复出,卡瓦尼时隔两个月再次代表博卡出场并打进一粒点球

懂球帝 浏览 555

10月车企交付数据汇总:小米小鹏均超4万,零跑破7万

三言科技 浏览 726

ESPN:因内马尔的身体状况和高额薪资,桑托斯不急于和他续约

懂球帝 浏览 965

比亚迪的智能化“梦想日”,到底有没有“王炸”?

钛媒体APP 浏览 12694

成都车展实拍坦克500,这家伙肯定能卖爆?

车业杂谈 浏览 20520

剑南春丨曼联客场2-2热刺,德利赫特读秒绝平,姆伯莫建功

懂球帝 浏览 692

售17.58万起,吉利银河E8正式上市

天天汽车 浏览 12502

突然宣布:停牌!市值曾超400亿……

21世纪经济报道 浏览 12388

加沙停火协议生效后的48小时:人质释放、民众返乡

澎湃新闻 浏览 1014

印工程师开发便携太阳能帐篷,可部署对峙前线

环球军事时报 浏览 26731

引力一号遥二运载火箭发射成功

环球网资讯 浏览 1036

薇娅道歉是什么原因引起的?昨晚直播没控制好情绪哭了....

趣看热点 浏览 26739

不愧章子怡,竟瞒着他做出这么吓人的事

Yuki女人故事 浏览 11323

男子研发恒压阀被认定枪支散件获刑 二审检方不起诉

封面新闻 浏览 112581

德国军方举行演习被当地警方误判为“威胁” 遭警方实弹还击

环球网资讯 浏览 814

中国AIGC用户破5亿,增长1倍;美团:今年超7成外卖低于15元;新能源事故,「破窗锤」被网友买爆

极客公园 浏览 1013

南部战区:中方参演部队已从军港出征

政知新媒体 浏览 1029

佩德罗:遗憾只进1球没拿到3分 轮换是为了备战之后对阵申花

直播吧 浏览 18818

《日掛中天》首波口碑!剧情被质疑渲染苦难,辛芷蕾演技获肯定

萌神木木 浏览 706

“跌跌不休”的汇率与狂飙突进的物价,俄卢布的未来将如何?

澎湃新闻 浏览 14584

太癫了,又一个国民女神翻车了

独立鱼 浏览 1021
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1