关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2468人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奔驰140岁生日,新款S级完成全球首秀,还提供三种动力选择

火星说车 浏览 1451

vivo S50外观揭晓!全新告白配色:田曦薇同款

快科技 浏览 2108

山东济宁一商家芒果礼盒藏试卷、课本 商家回应

极目新闻 浏览 3916

内存成本持续大涨,买手机电脑会越来越贵该怪谁?

江瀚视野 浏览 1705

向渠道要效率,理想汽车:将关闭一些能效低的门店,目前还处于评估阶段

时代财经 浏览 1488

德国Mindfactory平台数据:AMD处理器周销量是英特尔10倍多

IT之家 浏览 2226

男子在养生馆按摩后猝死次日才被发现 家属索赔140万

红星新闻 浏览 3823

男子花3万请网红带货:下599单仅成交4单收入700元

环球网资讯 浏览 12543

雷军:第一代小米SU7已停售!

大象新闻 浏览 1411

姚顺雨“露脸”,和唐杰杨植麟探讨AGI之路

字母榜 浏览 1694

足球报:亚泰外援卡米洛参加全队合练,但还没达到比赛状态

懂球帝 浏览 2717

锡安复出生涯首次替补18+6 鹈鹕送公牛9战第8败吉迪11+7+5

醉卧浮生 浏览 1955

蔚来ET5T暗影套装限定版上市 售价31.6万元

车质网 浏览 2653

张杰院士:三步走,2045建成上海首个聚变商业电站

澎湃新闻 浏览 3550

"分割顿巴斯"提议遇阻 北约秘书长赴美会谈

环球网资讯 浏览 2637

3场3球,塞尔塔前锋斯韦德贝里当选西甲12月最佳U23球员

懂球帝 浏览 1650

日均不到1000元机器人带回家?智元为机器人租赁市场带来“令人心动的offer”

时代财经 浏览 2648

“毛衣+豆腐裤”绝美!冬天就该这么穿!

Yuki女人故事 浏览 2187

纳瓦斯:得知转会曼联失败我十分冷静,这激励了我的皇马生涯

懂球帝 浏览 815

13日凌晨!成都一小米SU7发生交通事故后起火

网易汽车 浏览 2458

博士学历女厅官袭燕被双开:违规收受礼金、消费卡

红星新闻 浏览 7114
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1