关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2693人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这个意外走红的风格,冬天穿真的很加分!

黎贝卡的异想世界 浏览 3006

进博面对面|默沙东中国总裁唐凯宇:加速推动医药创新成果落地中国

中国商报 浏览 3650

若昂-内维斯卖便宜了?坎波斯:我们为他支付的价格很合理

懂球帝 浏览 2948

华语乐坛重量级编曲大师屠颖意外去世 儿子发文悼念

鲁中晨报 浏览 8372

4万店美宜佳,为何沦为假烟集散地?

斑马消费 浏览 1650

黄磊宣传乌镇用力过猛!戏剧节变夜店蹦迪现场,明星狂欢惹争议

萌神木木 浏览 3720

三季报丰收伴管理层大换血,洛阳钼业高光背后为何求变

华夏时报 浏览 3533

新增双色特别涂装 全新宝马X7将2027年上市

车质网 浏览 2388

将于北京车展首发 奕境旗下首款量产车路试谍照曝光

网易汽车 浏览 2611

美政府寻求查封数十艘与委内瑞拉有关联的油轮

国际在线 浏览 2624

天空:西汉姆联将继续信任努诺,俱乐部今天开会讨论引援问题

懂球帝 浏览 2612

贵州省能源局局长陈华接任茅台集团董事长

网易财经 浏览 3547

赵继伟伤后动态!工作室确定拉伤,待医生进一步检查!

篮球资讯达人 浏览 3397

中国色特别策划 | 故宫活力与故说新语

时尚COSMO 浏览 2736

科瓦奇:本塞拜尼能出战奥格斯堡;迪朗维尔先去二队恢复体能

懂球帝 浏览 3506

秦雯袭警风波升级!新剧开播前四天紧急撤档,上星困难唐嫣被牵连

萌神木木 浏览 3665

人类遗忘的难题解法,被GPT-5重新找出来了

量子位 浏览 3763

王家卫:“搞金靖”?

马庆云的影音娱 浏览 3546

马德里康普顿斯大学VERSE:AI实现文档视觉信息深度理解

科技行者 浏览 2622

牛弹琴:美国人大吃一惊 特朗普牵涉到了战争罪行

现代快报 浏览 16303

兹维列夫脚踝受伤遭横扫,严重肿胀紧急求医,总决赛征程蒙上阴影

网球之家 浏览 3552
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1