关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11354人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

阳光电源：前三季度净利润119亿元同比增长56%

网易财经浏览 747

网曝大S犯癫痫住院具俊晔带钱跑路，真相＂打脸＂了

不八卦会死星人浏览 18894

华为Pocket 2官宣将于2月22日发布

三言科技浏览 11904

baby近照撞脸刘嘉玲，苹果肌下垂脸变僵，没了事业心近乎退圈

萌神木木浏览 346

坦克队喜剧的内核是悲剧？

静易墨浏览 923

爱妻朱媛媛离世5月后，辛柏青又传来坏消息

阿废冷眼观察所浏览 1011

你在等新一代普拉多，还是现在入手坦克500？

Autolab 浏览 12621

梁洛施疑和李泽楷一起参加婚宴晒照曝光14岁长子

靓宁唠唠嗑浏览 14473

缩减配套募资额近五成军信股份重大资产重组即将上会

经济参考报浏览 11266

媒体人：杨鸣考虑回归CBA联赛执教，多支球队有意聘请他

懂球帝浏览 12500

航天专家被策反出卖核心情报国安公布抓捕画面

政知新媒体浏览 75058

别让丑内搭毁掉你的穿搭！这4款直接封神！

Yuki女人故事浏览 69

哔哩哔哩CEO陈睿：优质创作者是社会的财富丨2025世界互联网大会

红星资本局浏览 663

吴京易烊千玺主演的《长津湖》杀青了，这个是抗美援朝题材电影

趣看热点浏览 27874

台湾名嘴蔡正元：黄海8天实弹演习只是前菜

看看新闻Knews 浏览 362

遭美政府和科技企业联合施压欧盟扛不住了又打算屈服

澎湃新闻浏览 4720

俄媒：坠毁现场的两具尸体消失得无影无踪

环球网浏览 14379

香港证监会主席，发声！

中国基金报浏览 12528

全年终端销量超61万东风Honda满电进击下一程

Report汽车浏览 12778

阿尔特塔：厄德高和因卡皮耶身体状况不足以进入替补，好在有萨卡

直播吧浏览 1536

曹德旺投资百亿的大学，决定聘请计算机专家梅宏院士任校长

澎湃新闻浏览 14533

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

陕西夫妇在赞...

特朗普为美军...

赵继伟三分1...

6岁男童感染...

AI应用“牛...

售13.99...

坦克队喜剧的内核是悲剧？

＂鸡排哥＂在座谈会上发言被指＂讲出了6亿项目的气魄＂

2.9T V6插混全新一代奥迪RS 6谍照曝光

阳光电源：前三季度净利润119亿元同比增长56%

网曝大S犯癫痫住院具俊晔带钱跑路，真相＂打脸＂了

华为Pocket 2官宣将于2月22日发布

baby近照撞脸刘嘉玲，苹果肌下垂脸变僵，没了事业心近乎退圈

坦克队喜剧的内核是悲剧？

爱妻朱媛媛离世5月后，辛柏青又传来坏消息

你在等新一代普拉多，还是现在入手坦克500？

梁洛施疑和李泽楷一起参加婚宴晒照曝光14岁长子

缩减配套募资额近五成军信股份重大资产重组即将上会

媒体人：杨鸣考虑回归CBA联赛执教，多支球队有意聘请他

航天专家被策反出卖核心情报国安公布抓捕画面

别让丑内搭毁掉你的穿搭！这4款直接封神！

哔哩哔哩CEO陈睿：优质创作者是社会的财富丨2025世界互联网大会

吴京易烊千玺主演的《长津湖》杀青了，这个是抗美援朝题材电影

台湾名嘴蔡正元：黄海8天实弹演习只是前菜

遭美政府和科技企业联合施压欧盟扛不住了又打算屈服

俄媒：坠毁现场的两具尸体消失得无影无踪

香港证监会主席，发声！

全年终端销量超61万东风Honda满电进击下一程

阿尔特塔：厄德高和因卡皮耶身体状况不足以进入替补，好在有萨卡

曹德旺投资百亿的大学，决定聘请计算机专家梅宏院士任校长

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

陕西夫妇在赞...

特朗普为美军...

赵继伟三分1...

6岁男童感染...

AI应用“牛...

售13.99...

坦克队喜剧的内核是悲剧？

＂鸡排哥＂在座谈会上发言 被指＂讲出了6亿项目的气魄＂

2.9T V6插混 全新一代奥迪RS 6谍照曝光

阳光电源：前三季度净利润119亿元 同比增长56%

网曝大S犯癫痫住院具俊晔带钱跑路，真相＂打脸＂了

华为Pocket 2官宣将于2月22日发布

baby近照撞脸刘嘉玲，苹果肌下垂脸变僵，没了事业心近乎退圈

坦克队喜剧的内核是悲剧？

爱妻朱媛媛离世5月后，辛柏青又传来坏消息

你在等新一代普拉多，还是现在入手坦克500？

梁洛施疑和李泽楷一起参加婚宴 晒照曝光14岁长子

缩减配套募资额近五成 军信股份重大资产重组即将上会

媒体人：杨鸣考虑回归CBA联赛执教，多支球队有意聘请他

航天专家被策反出卖核心情报 国安公布抓捕画面

别让丑内搭毁掉你的穿搭！这4款直接封神！

哔哩哔哩CEO陈睿：优质创作者是社会的财富丨2025世界互联网大会

吴京易烊千玺主演的《长津湖》杀青了，这个是抗美援朝题材电影

台湾名嘴蔡正元：黄海8天实弹演习只是前菜

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

俄媒：坠毁现场的两具尸体消失得无影无踪

香港证监会主席，发声！

全年终端销量超61万 东风Honda满电进击下一程

阿尔特塔：厄德高和因卡皮耶身体状况不足以进入替补，好在有萨卡

曹德旺投资百亿的大学，决定聘请计算机专家梅宏院士任校长

＂鸡排哥＂在座谈会上发言被指＂讲出了6亿项目的气魄＂

2.9T V6插混全新一代奥迪RS 6谍照曝光

阳光电源：前三季度净利润119亿元同比增长56%

梁洛施疑和李泽楷一起参加婚宴晒照曝光14岁长子

缩减配套募资额近五成军信股份重大资产重组即将上会

航天专家被策反出卖核心情报国安公布抓捕画面

遭美政府和科技企业联合施压欧盟扛不住了又打算屈服

全年终端销量超61万东风Honda满电进击下一程