关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11374人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

豪森智能联手中科院沈自所,深化AI+制造业创新合作

财闻 浏览 879

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 757

恩佐:对凯塞多只有钦佩之情,能在切尔西和他并肩作战很开心

懂球帝 浏览 730

科学家开发“神经蠕虫”,实现颅内电极游走模式

DeepTech深科技 浏览 1656

代糖股大涨背后:阿斯巴甜陷入争议

中新经纬 浏览 15452

伊姐周六热推:电视剧《不眠日》;电视剧《照镜辞》......

伊周潮流 浏览 2026

预售35万起 小鹏X9增程版终结MPV续航焦虑

网易汽车 浏览 682

或首发搭载华为超500线激光雷达 岚图泰山11月将上市

网易汽车 浏览 916

连衣裙+运动鞋,今秋最美穿法!舒适又时髦!

Yuki女人故事 浏览 830

俄国防部:乌军大规模进攻又被击退 北约坦克被摧毁

环球网资讯 浏览 16645

逆天大瓜!孙楠和那英嘴对嘴亲吻!就是不知道对方的另一半怎么想

娱乐白名单 浏览 10829

撒贝宁与演员老父亲回广东 在当地出生会说粤语

罗罗娱乐精 浏览 19631

歌手黄安透露音乐人屠颖离世细节

情感大头说说 浏览 743

人类为了变美,都干出过哪些蠢事?

奔波儿灞与灞波儿奔 浏览 14965

诸葛亮死前交代刘禅6个字他却记反!光速败光蜀汉江山

趣看热点 浏览 26383

报道称阿根廷新外长与台湾进行"政府间"联系 中方回应

环球网资讯 浏览 75459

美国微软公司:10月14日起Windows 10将“停服”

财闻 浏览 1014

130斤大狗被主人带去爬山减肥 结果被2个守山人抬下山

潇湘晨报 浏览 70276

印度总统乘坐“阵风”战斗机进行飞行体验

环球网资讯 浏览 780

杭州男子金价大涨前卖6千克金条变现289万 1周少赚14万

潇湘晨报 浏览 83239

天气正好,和牛仔靴踏春去!

嘉人marieclaire 浏览 19441
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1