关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11355人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

会穿的女人衣服从不多买,春季备好这些时尚单品,年过40也很好看

Yuki时尚酱 浏览 12607

丁俊晖:来英锦赛心情和状态好;与特鲁姆普比赛是最难的

懂球帝 浏览 179

西媒:皇马为塞巴略斯提供3年薪水不变续约合同,球员还在思考

直播吧 浏览 18627

年轻人“追金弃钻” 开启一场消费认知的觉醒

新摘 浏览 14955

阿里京东,洗牌余波未了

市界 浏览 15462

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 920

钟丽缇长女出道拍广告!身材火辣混血五官好精致

叶公子 浏览 14414

澳网女单签表出炉:郑钦文上签有望再次突破,首轮多场焦点战上演

ALL体育 浏览 12888

菲方人员非法闯入中国黄岩岛礁盘活动 被警告驱离

中国海警局 浏览 78894

B站举办2023百大UP主盛典,“棋手战鹰”获直播年度黑马奖

网易科技报道 浏览 12974

此皇帝曾做过俘虏,还惨杀忠臣,却因一件事,留下了千古美名

趣看热点 浏览 25760

美国要求沙特在经济和军事上与中国保持距离

环球时报国际 浏览 14881

BP全员为Jennie庆生!公开超青涩合照曝其非主流一面,性感咬手指

文艺圈娱乐号 浏览 12976

她是钟小姐的穿搭榜样,从20岁到70岁,每一套都让人想copy

黎贝卡的异想世界 浏览 778

黄子韬婚礼险翻车!许艺洋喊错男朋友

林木体育解说 浏览 982

龚俊现身周杰伦演唱会 与周董合唱《发如雪》超嗨

素素娱乐 浏览 15429

张馨予否认生二胎,声称这几天馒头主食吃的太多了

趣看热点 浏览 26109

苏丹快速支援部队宣布同意实行人道主义停火

国际在线 浏览 667

东部战区护卫舰实兵实弹训练

环球网资讯 浏览 15910

小米汽车订单回收价跌至2000元 两月前曾溢价2万

鲁中晨报 浏览 4789

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 865
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1