关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2533人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

配1.5T增程/猎鹰700辅助驾驶 星途ET5预售15.99万起

网易汽车 浏览 2389

计划3年完成200个AI项目 川影联动人工智能协会打造“AI影视工业梦工厂”

封面新闻 浏览 2867

大爷拍"素颜巴黎"火了:欧洲行费用1万多 不会说英语

极目新闻 浏览 12342

全球首款飞行汽车来了!售价222万元,可以飞177公里

象视汽车 浏览 1953

今日热点:李庚希空降粉丝群抵制代拍;荷兰弟复工拍摄《蜘蛛侠4》……

伊周潮流 浏览 2487

售13.98万起 吉利新能源皮卡四驱山地版/高寒版同步上市

网易汽车 浏览 1842

四年减少771万!稳出生人口,要加力了

西部城市 浏览 1627

市值26亿豪掷32亿跨界“钠电”,环保企业“同兴科技”胜算几何?

时代周报 浏览 1983

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 2379

Motif发布12.7B模型:用小算力挑战大模型,效率与性能的"双赢"

科技行者 浏览 1506

告别臃肿!这种简约的高级穿法,别拒绝

Yuki女人故事 浏览 1588

河南村庄设环保监测点发通知限制燃油车进村 当地回应

大风新闻 浏览 15140

珍珠专场|| 无论20+还是60+,一定都会对它心动!

黎贝卡的异想世界 浏览 4535

香!嘴巴跟着他真是享福了

吐槽电影院 浏览 2215

具身智能何时实现“ChatGPT时刻”,王兴兴说了个关键前提丨聚焦进博会

红星资本局 浏览 2517

香港科大:用"随机策略"训练AI数学推理,效果竟然超越复杂算法

科技行者 浏览 2621

她不靠穿搭谋生,却因穿搭走红,在穿衣上找到主体性是什么体验?

黎贝卡的异想世界 浏览 2482

苹果iOS、谷歌 Android 系统将面临英国更严格反垄断审查

IT之家 浏览 2662

心系球队,梅西一家现身看台观战阿根廷vs委内瑞拉

懂球帝 浏览 2805

佩斯科夫:"海燕"巡航导弹试验不应影响俄美互动

国际在线 浏览 2595

创女子体育新高,WTA与梅赛德斯-奔驰达成每年4700万美元合同

懂球帝 浏览 1983
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1