关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2873人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:被昔日学生中国超越 欧洲落于人后的悲观正蔓延

澎湃新闻 浏览 4209

伊朗总统最新表态:将重建核设施

政知新媒体 浏览 2462

豪华MPV的"新解法" 吉利银河V900上市26.98万起售

车评社Auto 浏览 1486

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者 浏览 1685

近2万亿债务推进 出险房企提速化债

北京商报 浏览 2376

波罗的海三国正式退出《渥太华禁雷公约》

上观新闻 浏览 1852

五星级酒店被一双拖鞋打败了?酒店巨头的问题出在哪了?

江瀚视野 浏览 3308

刚放行中欧班列波兰又来找事 中方接下挑战书强硬反击

文雅笔墨 浏览 38558

2026年最火单品,竟然是一只20年前的机车包?

LinkFashion 浏览 1719

吉文:可能我有点老派,看不惯加纳乔走路歪着身子还挂条链子

懂球帝 浏览 2168

限时7.98万起 新款秦L DM-i/秦PLUS DM-i长续航上市

网易汽车 浏览 1678

秋天上班族应该怎么穿衣?衬衫为主、打造腰线,利落又得体

静儿时尚达人 浏览 2831

从0比5巴西到2比0巴拉圭!韩国为自己正名

体坛周报 浏览 2780

委内瑞拉内政部长称美国袭击造成100人死亡

新京报 浏览 1375

卡耐基梅隆大学发现让AI更聪明的秘诀:犯错后自我纠正

科技行者 浏览 1619

普京穿军装看俄白军演:试戴热成像战术眼镜 装填手枪

新京报 浏览 2651

今年一定要拥有这件“爆火单品”,让你美出新高度

LinkFashion 浏览 1558

告别“躺赚” 消金与小贷走向殊途

北京商报 浏览 1575

吉利大战欣旺达:江湖不是打打杀杀,是人情世故

诗与星空 浏览 1831

谷歌推迟安卓设备上谷歌Assistant向Gemini的迁移计划

IT之家 浏览 1968

国足出战FIFA系列赛!媒体人热议:托国际足联福,别一直闭门造车

奥拜尔 浏览 1709
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1