关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2531人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

央视一周 4 次点名全红婵,夺冠后真实处境揭开

寒士之言本尊 浏览 2369

张本智和惨遭逆转!痛失4个赛点+连丢3局,无缘法国冠军赛男单8强

乒谈 浏览 2603

亚马尔和网红参加节目时说皇马偷窃还抱怨,皮克表示同意

懂球帝 浏览 2693

二手车商称雷军在吹牛:现在有的车型降10万都没人要

都市现场 浏览 7013

记者:福登疑似手部骨折,具体伤情还要等待扫描结果

懂球帝 浏览 1599

宁愿净身出户,也要与闫妮离婚的邹伟现状如何?

律便利 浏览 2730

《狙击蝴蝶》开播!看完4集,我想说:都市爱情剧就该这么拍!

娱乐圈笔娱君 浏览 2180

桑乔替补登场又被换下,埃梅里:这不是惩罚,而是战术决定

懂球帝 浏览 2542

2025年10月我国新能源汽车销量占比超50% 历史首次!

智车情报局 浏览 2521

普京:俄罗斯将在战场解放本国故土 欧洲"猪猡"将下台

参考消息 浏览 12576

“大空头”11亿空单瞄准英伟达和Palantir,AI泡沫真的来了吗?

郭施亮 浏览 2513

辽宁无缘决赛采访!杨鸣回应赵继伟伤势,再谈辽粤对决展伤感话题

篮球资讯达人 浏览 2483

普京:“海燕”核动力巡航导弹完成“决定性试验”

极目新闻 浏览 2627

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 1993

男子给女友买的金镯子被放在门口丢了 顺丰只赔200元

潇湘晨报 浏览 7254

恩里克:这场比赛对登贝莱有帮助;我们希望继续赢得更多奖杯

懂球帝 浏览 1929

依旧神仙打架!沈腾吴京易烊千玺齐聚春节档

梦小娱 浏览 1624

“钢铁大亨”投资“口罩大王”,两个月浮盈近10亿

侃见财经 浏览 2480

佩斯科夫:"海燕"巡航导弹试验不应影响俄美互动

国际在线 浏览 2594

美国否决加沙停火决议草案后 以美代表亲切握手

看看新闻Knews 浏览 3412

都体:国米想租佛罗伦萨翼卫多多,愿意送出德弗赖或阿斯拉尼

懂球帝 浏览 1631
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1