关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻927人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

米莱宣布不加入金砖国家 被批"最愚蠢的变卦"

长安街知事 浏览 12983

约基奇穆雷同30+三双历史首次:掘金夺冠概率升至82% 斯波怎调整

颜小白的篮球梦 浏览 16380

日本汽车业面临停产风险!

电动知家 浏览 834

绿地张玉良,失去一员“大将”

红星资本局 浏览 1523

鸿蒙智行"9系"扩容 首款MPV智界V9来了

网易汽车 浏览 54

今年火了一种穿搭 既简单又时髦

猫姐品衣有道 浏览 15386

俄"默许"朱拉尼相关提案 中国在联合国动用一票否决权

梁讯 浏览 11504

小S大女儿拍视频曝真容性格活泼 背景引发争议

文艺圈娱乐号 浏览 13098

3个月内唐山8名厅官被查后 河北省委启动矿业专项巡视

界面新闻 浏览 64439

收藏这篇就够了!本地人私藏的广州逛吃指南

黎贝卡的异想世界 浏览 601

解放军战机再入台湾西南空域,倍感压力的台军开始自欺欺人

趣看热点 浏览 25922

消息称德国拒绝将英特尔建厂补贴增至100亿欧元

IT之家 浏览 16209

347亿市值三一重能,80后出任董事长,身家超过4.7亿

华美财经 浏览 682

日股大跌,政坛地震威胁“高市交易”

国际金融报 浏览 949

AI时代,重做ERP

钛媒体APP 浏览 992

天冷了,“彩色毛衣”这么穿美翻了!

LinkFashion 浏览 693

正式上线,GitHub向所有用户开放全新代码搜索引擎

机器之心Pro 浏览 18239

有品味的中年阿姨,穿衣搭配都有4个共同点,学会了优雅到老

静儿时尚达人 浏览 661

何时首秀?洛城记者:哈登和塔克预计不会出战明天与湖人的比赛

直播吧 浏览 13268

鞠婧祎新剧造型到底用了多少发际线粉?

新氧 浏览 16005

今夏最佳转会是❓罗马诺:麦卡利斯特,伟大的转会,只花近4000万欧难以置信

直播吧 浏览 14180
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1