关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻936人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

春季针织衫搭什么?试试这三种时髦又显瘦

In风尚 浏览 19879

奥委会宣布将从中国采购疫苗,供东京奥运及北京冬奥会参赛者使用

趣看热点 浏览 406883

周末穿搭!7套look,随便搭都好看!

美芽 浏览 15952

一场跨亚欧大陆的国际科技合作,为何在成都这个实验室展开?丨成都有客来

红星新闻 浏览 10847

全新设计语言/展车3月到店 领克07 EM-P全球首秀

网易汽车 浏览 12148

80岁贝利接种中国新冠疫苗 呼吁人们遵守防疫规则

网易体育 浏览 26795

快船官宣贝弗利左手骨折,将暂时无限期缺阵

趣看热点 浏览 25648

申万宏源:牛市1.0高点看26年春季 关注储能、存储、创新药与国防军工

智通财经 浏览 540

40+女人穿衣不要太花哨!学会这些高级感搭配,美得无可挑剔

静儿时尚达人 浏览 13485

40岁童瑶与42岁蒋欣:气质对比很明显

大眼妹妹 浏览 686

黄磊女儿多多现身机场 与路人合影弯腰被赞有礼貌

娱絮 浏览 14675

2-4遭海牛逆转,国安追平队史中超主场单场丢球纪录

懂球帝 浏览 799

两家社保抱团重仓4500万股,养老金买了400万股,年利润20亿

资本百科 浏览 12312

品热红酒的季节又到了,想好怎么穿了吗?

《瑞丽服饰美容》 浏览 13484

白宫官员:僵持数月后 美国正在放行中国光伏电池板

财联社 浏览 98422

TA:曼联今夏额外借贷1.05亿镑用于引援,目前总债务6.37亿镑

直播吧 浏览 1645

房租飞涨,加拿大将限制国际学生

环球时报国际 浏览 12949

小S二女儿穿露脐装跳舞,被指动作僵硬难看

乔米世娱乐说 浏览 19723

财经早餐:中秋国庆旅游市场迎热潮;摩尔线程IPO过会拟募资80亿元

网易财经 浏览 1441

退学炒股:2年实现150倍收益,悟道前,曾被骂“一辈子是韭菜”

60秒商业解读 浏览 12721

瓜迪奥拉:德布劳内伤势严重将缺席数月,我们要决定是否手术

直播吧 浏览 14396
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1