关闭广告

用图片来存储记忆,AI助手可以更聪明地处理长对话了

科技行者2512人阅读


提到人工智能助手,你可能经常遇到一个烦人的问题:当对话越来越长时,AI似乎越来越健忘。为什么会这样呢?这不是因为AI变笨了,而是因为大语言模型有一个硬性限制——它们的"注意力窗口"就像一个大脑的工作记忆,容量是有限的。当信息堆积得太多时,重要的细节就开始模糊,AI开始犯错。

这项由美团、中国科学技术大学和新加坡国立大学的研究团队发表于2026年1月的突破性研究,提出了一个全新的解决方案。他们的论文《MemOCR:用于高效长视野推理的布局感知视觉记忆》(论文编号:arXiv:2601.21468v1)介绍了一种完全不同的思维方式——与其像记笔记一样用文字堆砌信息,不如用图片来存储记忆,让关键信息在视觉上更突出。听起来有点奇怪?不妨跟我一起深入理解这个聪明的创意。

想象一下,你正在做一个很长的采访记录。如果你用普通方式记笔记,你会列出所有信息:姓名、背景、关键观点、补充细节等等,每一条信息都占用同样的空间。但如果你用一个更聪明的方式,你会用大字号标题强调人名,用粗体突出关键观点,用小字体记录辅助信息,这样即使记录被压缩得很小,重要信息仍然清晰可辨。这正是MemOCR所做的事情。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

E句话|姚晨曹郁官宣离婚

仙女事件簿 浏览 1603

日首相官邸官员表示:日本应该拥有核武器

澎湃新闻 浏览 12598

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

硅谷101 浏览 3431

从百亿到两百亿:董宇辉2025年做对了什么?

字母榜 浏览 2737

迈凯伦新专利 赛道模式将锁定使用场景

车质网 浏览 3107

皮尔斯:如果我和詹姆斯年纪相同,他绝对不可能拿到4座冠军

懂球帝 浏览 3635

刘润:企业盈利的5种模型

创业家 浏览 3630

勇士不敌湖人!波杰统领攻守,替补2将齐爆,库明加格林失误多!

篮球资讯达人 浏览 3774

多地突然取消!小地方,不配办马拉松了?

西部城市 浏览 3483

百度再战高德,还拉来了两大“帮手”

螺旋实验室 浏览 3785

朱啸虎们押注的300元AI玩偶,先得跑赢「退货潮」

豹变 浏览 3561

特朗普调侃让委内瑞拉成第53个州

红星新闻 浏览 2353

塔吉克斯坦总统强烈谴责塔阿边境地区武装袭击事件

环球网资讯 浏览 3165

全运会男足:上海U20 3-2新疆U20,刘诚宇、蒯纪闻破门,李新翔绝杀

懂球帝 浏览 3354

日媒炒作"台湾有事美军放弃撤离冲绳" 渲染美对日支持

环球网资讯 浏览 24308

东方甄选线下店开业:不卖菜卖简餐,全标品

商业观察家 浏览 332

看了今年春晚阵容,难怪球球评论区沦陷,大家太思念本山大叔了

萌神木木 浏览 2672

奇瑞集团前11月销量256万辆 新能源突破80万辆

网易汽车 浏览 3199

聚辰半导体冲刺港股:9个月营收9.3亿利润3.1亿陈作涛控制24%股权

雷递 浏览 2594

五星级酒店被一双拖鞋打败了?酒店巨头的问题出在哪了?

江瀚视野 浏览 4260

撒贝宁随李白回加拿大探亲,俩人带着龙凤胎闲逛

二妹扯娱 浏览 3735
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1