关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1657人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

斯瓦泰克输高芙无碍晋级!波兰淘汰美国,连续3年跻身联合杯决赛

全景体育V 浏览 1674

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 2830

腾讯突破:AI实现对话到电影的完整自动化制作

科技行者 浏览 1445

超长续航+高阶智能NOA,极狐全新阿尔法T5预售12.38万起

HiEV 浏览 2882

闪电快讯|东风奕派eπ007+正式上市 限时焕新价13.99万元起

电厂 浏览 2571

末节11分!连续7场上双!胡明轩拾巅峰锁胜局,内外线杀伤力拉满

篮球资讯达人 浏览 1518

海南封关首日:30克金饰省近万元 居民排长队买榴莲

极目新闻 浏览 13109

冰雪穿越理念 宾利添越Concept X官图发布

车质网 浏览 1440

章子怡晒照为女儿醒醒庆生!

韩小娱 浏览 1502

加沙停火草案被美国一票否决 中国大使发出"灵魂三问"

每日经济新闻 浏览 14269

尹锡悦看守所内收超6.5亿韩元代管金 系总统年薪2.5倍

鲁中晨报 浏览 7136

鲁比奥称对巴拿马涉港口裁决感到振奋 外交部回应

北京日报 浏览 93454

NVIDIA 向英特尔投资 50 亿美元 共同开发 AI 基础设施和个人计算产品

经济观察报 浏览 3500

日企天空推出UMPC新品TENKU Pocket 8,搭载N305处理器

IT之家 浏览 1012

女人年纪大了怎么穿?衣选长、鞋带跟,会叠穿,优雅有范儿

静儿时尚达人 浏览 2100

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 1934

司晓迪扯出内娱灰产,难怪王大发连夜起诉割席,网友呼吁整治内娱

萌神木木 浏览 1284

40岁邓莎宣布离婚!直言无法改变路行,将告别过去追求新的人生

萌神木木 浏览 1598

伊朗高级军官:以色列威胁言论暴露其“动荡和软弱”

上观新闻 浏览 1911

李凤刚出任北京现代总经理,20 年来首次由中国本土人才代表韩方

IT之家 浏览 2511

泸天化“三合一”高管王斌因个人原因辞职,总经理傅利才暂代财务总监、董秘职务

红星资本局 浏览 821
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1