关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2874人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

「以演聚力·链动共生」文旅商体展融合专场私董会成功举办!| 2025文创新势力超级私董会

第一财经商业数据中心 浏览 2540

女子结婚14年被丈夫打了13年 丈夫:我才是受害者

中国新闻周刊 浏览 12985

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 3281

以军在加沙城行动最新画面公布

环球网资讯 浏览 3499

格林伍德2025年联赛打进22球法甲最多,为2018年后马赛首人

懂球帝 浏览 1944

李湘王岳伦合体露面被偶遇,离婚后仍相处融洽,两人身材很富态

扒虾侃娱 浏览 2622

视频:单日发射数百架 俄乌无人机互袭更趋激烈

环球网资讯 浏览 1688

日本首相选举局势突变 高市早苗的竞争对手出现了

极目新闻 浏览 5893

越涨越卖?英伟达市值冲破5万亿,黄仁勋半年套现10亿美元

华尔街见闻官方 浏览 2559

瑞典拉普兰:凛冽北境的万物平衡之道

时尚COSMO 浏览 1887

这6款发色居然这么火?50张图可以直接给tony

Yuki女人故事 浏览 793

媒体:高市当选新首相 极端保守立场或激化与中国矛盾

环球网资讯 浏览 7806

冲着唐嫣去看《爱情没有神话》,却被演反派的冯绍峰吸引了

温柔娱公子 浏览 2750

又来?富保罗节目搭档:湖人应交易东契奇,他能换3倍里夫斯的筹码

懂球帝 浏览 1607

茶里回应欠薪:大部分在职员工欠薪兑付已完成,离职员工欠薪问题正分批解决

红星资本局 浏览 1610

北约谈格陵兰岛问题渲染"中国威胁" 外交部回应

新华社 浏览 18616

看玄彬孙艺珍这样撒糖,谁能扛得住

Yuki女人故事 浏览 2216

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 2545

大S妈妈晒自拍照,重拾对生活的信心,率领S家人过新生活

素素娱乐 浏览 673

永辉胖东来式调改店+1,盐城首店开业

新零售财经 浏览 1673

累坏了,库尼亚打进扳平球+中框1次,贡献解围2次拦截2次

懂球帝 浏览 1746
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1