关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3899人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年春天最美搭配:西装+半裙,怎么穿都好看!

LinkFashion 浏览 1895

大疆Osmo Pocket 4云台Vlog相机被曝3月发布,分标准/Pro版

IT之家 浏览 2632

负债亏损盈利:三家央企新能源谁更胜一筹?

汽车公社 浏览 3154

尹锡悦看守所内收超6.5亿韩元代管金 系总统年薪2.5倍

鲁中晨报 浏览 8099

冬季穿衣不用太复杂!内搭选高领、外套选简约款,大方又耐看

静儿时尚达人 浏览 2013

张之臻冲开门红失利白卓璇弥补遗憾,女单最大冷门成就土耳其历史

网球之家 浏览 2555

广东,哪里“阳气”最旺?

博闻财经 浏览 2973

秋天上班族应该怎么穿衣?衬衫为主、打造腰线,利落又得体

静儿时尚达人 浏览 3791

40岁童瑶与42岁蒋欣:气质对比很明显

大眼妹妹 浏览 3522

变阵冲决赛!U23国足VS越南首发:狂换6人 向余望先发王钰栋替补

我爱英超 浏览 2673

这届年轻人,为什么在B站写起“百字长评”?

海克财经 浏览 2604

稳增5.6%!武汉GDP站稳2.2万亿

虎投邦 浏览 2353

一小米SU7在行驶中突然失控:前轮车轴完全断裂

PChome电脑之家 浏览 3707

陈天桥亲自下场押注脑机接口赛道,中国首家超声波BCI企业格式塔成立

华夏时报 浏览 2730

双11链接合集 || 一键查缺补漏,这些宝藏别错过!

黎贝卡的异想世界 浏览 3590

锦州银行落幕引发渠道整合,超1600只基金上演“代销大迁徙”

券商中国 浏览 3446

河南最大城商行迎博士行长,曾任濮阳副市长、为湖南大学校友

湘财Plus 浏览 3927

小米现车选购争议:提车等半年 转头卖现车?

网易汽车 浏览 3011

戳破马拉松泡沫经济

诗与星空 浏览 3599

乌代表团“换将”赴美 佩斯科夫:俄方只和美国谈

每日经济新闻 浏览 3142

伊朗指责美以策划动乱 哈梅内伊呼吁伊朗人民保持团结

环球网资讯 浏览 2647
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1