关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻947人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

性能再升级 保时捷911 GT3 Manthey官图发布

车质网 浏览 393

宋代变法名臣王安石为何会一直刁难苏轼?

趣看热点 浏览 26106

事闹大了!中央政法委批郑爽代孕弃养普拉达与郑爽终止合作

趣看热点 浏览 26105

B站举办2023百大UP主盛典,“棋手战鹰”获直播年度黑马奖

网易科技报道 浏览 12983

宫崎骏《你想活出怎样的人生》拿下奥斯卡奖

网易娱乐 浏览 11930

人类为了变美,都干出过哪些蠢事?

奔波儿灞与灞波儿奔 浏览 14955

作秀式调研书记涉案超1亿:支持他人写书宣扬其"功绩"

新京报 浏览 75213

斯坦福火遍全网的做菜机器人,原来还得靠遥控

差评 浏览 12638

读懂IPO|奥特蛋真有暴利?金添动漫靠情绪价值年入近9亿元,正由经销批发走向零售店

时代周报 浏览 738

京东“牵手”董宇辉?相关方案已在评估

21世纪经济报道 浏览 12251

“官僚主义”缠身的亚马逊,开始被多面夹击

虎嗅APP 浏览 563

特斯拉新版Model Y实车现身!优化调整,预计最快10月下线

车矩阵更懂车 浏览 12731

台媒曝窦靖童疑结婚!无名指戴戒指,赴台与男人吃饭,曾辟谣婚讯

文艺圈娱乐号 浏览 12943

黄磊一家五口现身乌镇戏剧节 儿女们露脸颜值获赞

叶公子 浏览 13563

1399元,JBL SOUNDGEAR CLIPS琉璃扣耳机预售

IT之家 浏览 976

实拍斯巴鲁PERFORMANCE-B STI概念车:传奇随时可以复活,无奈量产成本太高

驾仕派 浏览 640

拜登:英美空袭也门胡塞武装系回应其袭击国际船只

界面新闻 浏览 12437

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 4738

北京现代纯电SUV EO羿欧开启预售 13–15万元

网易汽车 浏览 947

涨工资,落地!

国是直通车 浏览 821

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 187
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1