关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者678人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李子峰求婚,第一眼看成李易峰?李子峰就是张天爱的前男友

趣看热点 浏览 28228

台失联战机同队士官长自杀,此前于深海已确认黑匣子信号

趣看热点 浏览 70281

岚图冲刺港股0融资:车型“偏科”,年销目标前9月完成48.5%

尺度商业 浏览 1015

有银行今年降了七次!存款利率又双叒下调

21世纪经济报道 浏览 943

让城市有“面子”更有“里子” 建设韧性城市行动方案发布

央视财经 浏览 915

拜登:以色列已同意在斋月期间不进行军事活动

财联社 浏览 12380

1万多买的老马6,用着怎么样?

萝卜报告 浏览 12352

不管人情世故那一套!东风日产法务贴脸开大,直接点了友商的名

小李车评李建红 浏览 63

今年流行“一刀切”发型 好打理又轻盈

成铭聊发型 浏览 19735

中国脑机接口发展提速:“机智”上新,从实验室走向市场

第一财经资讯 浏览 10817

女星参加晚会丢2万元戒指 哭诉自己赔不起被吐槽

娱乐团长 浏览 12892

大兴土木,莫迪打造“印度梵蒂冈”

环球时报国际 浏览 12683

提供多种风格前脸,东风风行游艇V9申报图曝光

天天汽车 浏览 12522

斯卢茨基:最后时刻丢球难以接受,争冠主动权已不在我们手中

懂球帝 浏览 1600

明明精心打扮,看起来还是比同龄人显老?

猫姐品衣有道 浏览 13498

今年冬天最火搭配:毛衣+毛衣,放松穿更好看!

LinkFashion 浏览 360

翁青雅被官媒点名,言辞直戳其肺管子

娱乐圈笔娱君 浏览 723

冯德莱恩:欧盟将向乌提供紧急能源援助

每日经济新闻 浏览 702

冬天有这几件基础款就够了

Yuki时尚酱 浏览 13331

马国明因工作与女友暂分开 晒定情玩偶解相思

网易娱乐 浏览 26951

秋天上班族应该怎么穿衣?衬衫为主、打造腰线,利落又得体

静儿时尚达人 浏览 1043
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1