关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3897人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

砍树?佩杜拉:马特塔与AC米兰渐行渐远了

懂球帝 浏览 2479

谢霆锋跟着遭殃!英皇力捧张敬轩回内地被抵制

可乐谈情感 浏览 737

OpenAI 呼吁美国政府将芯片法案的税收抵免扩大至 AI 数据中心

IT之家 浏览 3455

除了阔腿裤,这条裤子今年最流行!

LinkFashion 浏览 1634

格林伍德2025年联赛打进22球法甲最多,为2018年后马赛首人

懂球帝 浏览 2935

紫光展锐发布端边AI芯片平台N9系列:4nm工艺,Arm v9.2 CPU

IT之家 浏览 229

大幅上调英伟达目标价,这家大行的理由:台积电产能分配远超预期,OpenAI“闭环交易”

华尔街见闻官方 浏览 3772

采用SSP全新平台 新款奥迪A4最新消息曝光

乐选爱车 浏览 3875

【观察】一打强队就出问题,齐沃打硬仗还欠火候

体坛周报 浏览 3158

4月起 光伏产品出口退税归零 千亿产业 谁在窃喜?

中国能源网 浏览 2639

新款享界S9纯电版曝光 尾部细节调整

网易汽车 浏览 3829

法国将在格陵兰岛开设领事馆 法外长:这是个政治信号

鲁中晨报 浏览 7938

博主:咪咕要求CBA独家版权并介意和担心抖音介入,但篮协主张非独家

懂球帝 浏览 2968

路虎行驶7千公里检出"缸体沙眼" 厂家仅同意换气缸盖

澎湃新闻 浏览 10430

申花亚冠赛季首胜!连战蔚山首尔不败,阿苏埃建功,延续5大纪录

奥拜尔 浏览 3670

淘宝去复杂,抖音延周期,2025双11平台直降抢客?

蓝鲸新闻 浏览 3782

向华强说娱乐圈明星美女他看不上眼:极致宠溺背后的事业共生学

互联观察联盟 浏览 2549

以色列又对加沙开火 内塔尼亚胡被指曾想请示特朗普

澎湃新闻 浏览 3495

马斯克:特斯拉Optimus机器人将成为“令人难以置信的外科医生”

IT之家 浏览 3565

租客死亡4年后房东以"房屋贬值"把中介告了 法院判了

封面新闻 浏览 9340

神奇少帅诞生!陈涛2战6分上岸,媒体人狂赞:比不靠谱洋帅强多了

奥拜尔 浏览 3616
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1