关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2878人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

或2027年发布 全新丰田凌放Harrier谍照曝光

车质网 浏览 2167

欧盟同意无限期冻结俄央行在欧洲资产

大象新闻 浏览 1940

工银安盛迎来准80后总精算师,总经理尚未正式就任

财经众议院 浏览 1677

联合国官员:加沙教育系统状况是灾难性的

北青网-北京青年报 浏览 2708

媒体:泽连斯基妥协 刚冻结俄资产的欧洲"惊觉一场空"

上观新闻 浏览 18737

岚图汽车卢放:必须啃下豪华轿车市场这块“硬骨头”

经济观察报 浏览 2090

美国女子被ICE特工枪杀 曾被定性为“国内恐怖分子”

红星新闻 浏览 6288

特斯拉第三季度财报亮点:交付创新高,能源业务强势领跑

不看车bukanche 浏览 2569

蔡康永发文缅怀大S,说大S应该被好好疼爱的

素素娱乐 浏览 1366

泰国海军做好战争准备 特朗普要电话调停泰柬冲突

环球网资讯 浏览 2110

推15款新车,鸿蒙智行的野心,是2026年正式超过奔驰?

路咖汽车 浏览 2108

利智输了?李连杰终是没放下一直亏欠的“她”

顾史 浏览 1579

李小龙妻子琳达晚年透露:丈夫其实很怕一种对手

南书房 浏览 2393

一句话,干掉586亿

深蓝财经 浏览 3438

深圳“清朗”行动发布通报:查处一批恶意营销、滥用AI账号

南方都市报 浏览 1758

足球报:曾有公司有意收购广西平果,但因欠账问题方面没谈拢

懂球帝 浏览 1875

浙江助教:尽全力去拿下胜利;对王钰栋和张瑷晖的缺阵有预案

懂球帝 浏览 2591

美军高官称希望韩建核潜艇对抗中国 还引了句"蜘蛛侠"

澎湃新闻 浏览 43938

她连上5次春晚,私下却和恩师同居怀孕被骗流产

律便利 浏览 2639

从“AI猪食”到“大模型旅鼠”,2025年度热词背后的新商机

吴晓波频道 浏览 1987

阿里研究:视频制作迎来"遥控器"时代,想让画面怎么动就怎么动

科技行者 浏览 1747
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1