关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者680人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美防长:若乌克兰战败 我真的认为北约将与俄罗斯开战

每日经济新闻 浏览 81751

三项MVP榜单第1+CBS评第1超巨:约基奇三连MVP很稳 掘金1点还加码

颜小白的篮球梦 浏览 18898

2021NBA全明星第一轮投票结果出炉,杜兰特力压詹姆斯成票王

趣看热点 浏览 25493

拉夫罗夫:瓦格纳事件后 俄罗斯变得更加稳定和强大

环球网 浏览 88404

向五角大楼匿名捐赠1.3亿美元"军饷"的富豪身份披露

鲁中晨报 浏览 6325

延迟写《南京照相馆》?好电影,确实是对比出来的

娱乐官已上任 浏览 1629

台媒:台陆军八军团弹药库附近昨突然起火

环球网资讯 浏览 18499

直瀑式格栅/3种座椅布局 第三代豪越L正式亮相

网易汽车 浏览 639

蔚来手机即将上市,网友反馈蔚来现已向车主征集购买意向

IT之家 浏览 14554

大厂高P跳槽中小企业,为何不欢而散?

Tech星球 浏览 16772

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 592

昊铂HT2024款亮相粤港澳车展 公布昊铂智驾早鸟计划

网易汽车 浏览 11456

或命名星光560 五菱宏光侠量产版实车曝光

车质网 浏览 276

美官员谈布林肯访华:并不期待可交付成果清单

环球网资讯 浏览 16684

荣耀MagicOS 10系统第四批内测招募开启,截至11月19日

IT之家 浏览 744

一网友称车辆在京东养车做保养后发动机报废

大象新闻 浏览 883

秋天穿阔腿裤,选对鞋子才时髦!

LinkFashion 浏览 15268

小米SU7成都事故惨烈 "打不开的门"问题在哪儿

网易汽车 浏览 1073

以士兵误杀本国人质细节披露民众群情激愤

红星新闻 浏览 13182

赵本山女儿力挺辛巴,是真性情还是情商低

趣看热点 浏览 26403

麻省理工学院发明“可注射”脑机芯片,有潜力用于治疗老年痴呆症

IT之家 浏览 536
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1