关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2875人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小S发跨年照纪念大S 对比去年跨年照不止少一个

并不擅长圈粉的铁任 浏览 1756

福建舰更多细节公布 一组动图全方位看清楚

央视新闻客户端 浏览 1960

绕开监管突破24%限制 分期商城变相放贷息费高达60%

南方都市报 浏览 2003

月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则

IT之家 浏览 1694

科技巨头再投500亿瞄准这个赛道

中国新闻周刊 浏览 2499

U20世界杯4强出炉

体坛周报 浏览 2812

武契奇预测:48小时内伊朗遇袭

极目新闻 浏览 7979

杠杆资金流入 北方铜业股价创28年新高

21世纪经济报道 浏览 3437

IPO倒计时,解码希迪智驾“攻守道”

第一财经资讯 浏览 2071

赵丽颖玩大了!《小城大事》预告信息量炸裂,不愧是争剧王的大剧

娱乐圈笔娱君 浏览 1711

智己LS8官图发布:5米车长增程动力 理想L8怕了吗

大李说车 浏览 1499

诺贝尔委员会拒绝和平奖转让特朗普

环球时报 浏览 6272

海港亚冠8战不胜!3轮仅1分,对日本球队9战不胜,延续5魔咒

奥拜尔 浏览 2695

欧洲航天局:中欧合作“微笑”卫星将于明年 4 月至 5 月发射

IT之家 浏览 2651

秋季上市 2026款大众ID. Cross谍照曝光

车质网 浏览 527

美将暂停实施对华海事等301调查措施一年

财联社 浏览 8815

王岳伦否认李湘涉缅北诈骗,否认王诗龄休学

扒虾侃娱 浏览 1540

报告称机械硬盘价格触底反弹,平静2年后将迎新一轮涨价潮

IT之家 浏览 2048

冬季羽绒服是最“受捧”的单品,这样选款和搭配,舒适耐看

静儿时尚达人 浏览 967

特朗普:空管员不返岗就扣薪 建议停摆期未请假者奖钱

鲁中晨报 浏览 31011

保时捷中国自建充电网络将关停,回应:重新调整资源 前三季度利润下跌99%

红星资本局 浏览 2042
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1