关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11378人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

爱德华兹像乔丹又实锤了? 火箭名宿:没人像乔丹但我喜欢华子

仰卧撑FTUer 浏览 1009

美首任女海军作战部长:曾任驻韩美海军司令

环球网资讯 浏览 12584

国米vs凯拉特首发预测:巴雷拉踢后腰,劳塔罗继续首发搭皮奥

懂球帝 浏览 749

詹姆斯惊天隔扣 湖人替补席惊呆了!!!

直播吧 浏览 12215

中国手机厂商印度劫:查税与搜查后 要求引入印资

时代周报 浏览 16263

培根:人追财,累死人!看透这4条法则,让钱自己“送上门”

60秒商业解读 浏览 12257

崔天凯"隔空回呛"布林肯:中国从没想过做事要让美喜欢

环球网 浏览 94987

美国中央司令部称拦截胡塞武装射向美军舰的导弹

财联社 浏览 10915

陈涛:保级不能只寄希望于领袖球员;结果不好,我一人来承担

懂球帝 浏览 1040

刚刚,“海澜之家号”升空!

江南晚报 浏览 1061

日媒称在外长记者会上日媒没有提问的机会 外交部回应

齐鲁壹点 浏览 86003

被央媒怒批!目不识丁、脑子空空

东方不败然多多 浏览 1025

10家车企补贴“倒计时” 谁在让利谁在锁单?

汽势传媒 浏览 747

美方拟禁止中国航司飞越俄罗斯领空 中国航司联名回复

澎湃新闻 浏览 4840

3家银行下调存款利率 大行下调利率的可能性几何?

澎湃新闻 浏览 18226

近13年总决赛勇士和热火共打进12次 但从未正面交锋

直播吧 浏览 16293

2000万美元重注强脑科技,三七互娱落子脑机接口新纪元

钛媒体APP 浏览 719

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 985

美乌总统再度激烈争吵 特朗普爆粗口还把地图给扔了

扬子晚报 浏览 6728

欧阳娜娜的姐姐欧阳妮妮与张书豪牵手,举动无比亲密!

趣看热点 浏览 26312

有反转?王力宏方发声否认李靓蕾在美国胜诉

网易娱乐 浏览 17065
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1