关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻944人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

乌方:可能会在两个月内接收首批F-16战机

环球网 浏览 15572

沉闷冬日需要有色彩的穿搭,咱们也做一次好“色”之徒。

伊周潮流 浏览 12869

美拉德之后,格雷系穿搭突然火了!

LinkFashion 浏览 13572

港交所陈翊庭:香港IPO发行量全球第一,近半来自A股公司!宁德时代股价翻倍

时代周报 浏览 860

球鞋突然时髦起来?达人们又在抢着穿了

虎哥说衣不二 浏览 19418

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

钛媒体APP 浏览 569

南安普顿官方:与主帅拉塞尔-马丁续约3年,上赛季带队冲超

直播吧 浏览 10689

乌克兰男子闯进村委会会议现场引爆手榴弹

这视频 浏览 12668

社交电商,一场集体幻灭的资本游戏

钛媒体APP 浏览 77

我和我太奶竟然用的是一个Tony

时尚COSMO 浏览 13549

奥特曼无罪重返董事会!OpenAI内讧真相大白,调查结果公开

量子位 浏览 12441

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 1064

公牛官方:帕威左脚遭遇急性骨水肿 将在两周后进行重新评估

直播吧 浏览 12534

AI深度伪造引发担忧!大选临近美FBI、NSA正严阵以待

财联社 浏览 12460

包括氢动力版本 宝马全新一代X5最新消息曝光

乐选爱车 浏览 1428

加拿大留学7年,95后小伙回杭开奔驰摆摊卖盒饭!“大家都只活一次,重要的就是体验生活”

都市快报橙柿互动 浏览 354

新能源购置税免征时代,正在结束

盖世汽车 浏览 860

适合40岁女人的三种穿衣公式 清爽又洋气

Yuki时尚酱 浏览 15985

试图抢占先机!谷歌将生成式人工智能引入在线购物领域

财联社 浏览 16177

又添新身份!人气带货主播李佳琦增补为上海青联委员

趣看热点 浏览 25985

京东系高层大换防

全天候科技 浏览 15909
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1