关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3904人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全球知名对冲基金投资人:中国业务超越预期

中国基金报 浏览 3275

爱马仕继承人,千亿家产被最好的朋友骗光

Yuki女人故事 浏览 3202

雅图高新被举报后发长文反驳:谁是谁非需捋清 北交所非“垃圾箱”IPO企业非出气筒

财经下午茶 浏览 3577

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 8672

里程碑,勇士主帅科尔取生涯执教第600胜&位列NBA第28位

懂球帝 浏览 1606

4年8000万美元?解析火箭续约伊森前景:最终达成可能性较大

罗说NBA 浏览 3651

天津外援阿代米谈胜利:现在要做的是忘掉这一场比赛,准备下一场

直播吧 浏览 4411

今日热点:电影《震耳欲聋》定档1004;《惊天魔盗团3》发布新预告……

伊周潮流 浏览 5810

辞旧迎新,元旦档电影满意度发布!

幕味儿 浏览 2623

Perplexity Comet浏览器iOS版发布,AI驱动超厉害!

IT之家 浏览 1718

华为Momenta争夺保时捷,全球大厂智驾再度“投华”

汽车公社 浏览 2678

沃勒尔:德国队首发门将仍存在变数,特狮必须稳定上场才行

懂球帝 浏览 2920

或2027年发布 全新丰田凌放Harrier谍照曝光

车质网 浏览 2924

影星梁小龙去世,曾拒绝拒再跟周星驰合作

TVB剧评社 浏览 2577

工行、建行:暂停办理投资金部分业务

央视财经 浏览 3490

腾势Z9GT 3月5日开启预售 单电机版本续航1036km

网易汽车 浏览 2045

76岁欢喜哥去世!众星悼念

查尔菲的笔记 浏览 3556

11.99至15.99万元 长安启源A06开启预售

网易汽车 浏览 4218

海南上演追尾"神剧情" 酒驾司机撞的"受害者"也是酒驾

环球网资讯 浏览 7937

杨立昆、李飞飞等提出空间超感知范式,用预测未来代替暴力记忆

DeepTech深科技 浏览 3308

美的与华为强强联合,共拓AI领域创新生态

正解局 浏览 4527
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1