关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻942人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:贝蒂斯与阿约泽-佩雷斯就免签达成协议

直播吧 浏览 15271

推广中奖名单-更新至2025年10月25日推广

黎贝卡的异想世界 浏览 679

詹姆斯经纪人旗下球员三人首日席卷3.9亿美元!范弗里特3年1.3亿

Emily说个球 浏览 15306

章子怡带娃参加《酱园弄》杀青宴,贴心亲吻儿子,4岁儿子皮肤白

缘木不求娱 浏览 11597

美防长“瞒报住院”或暴露美军指挥链风险

环球网资讯 浏览 12664

向太和向佐回应“向家破产”传闻

韩小娱 浏览 1522

闻泰科技营收147亿的半导体资产被荷兰政府冻结

每日经济新闻 浏览 995

特斯拉前全球销售主管爆猛料

电动知家 浏览 245

除了红色,过年一定要有这件单品 | 好物

LinkFashion 浏览 12991

46岁郭柯宇气质真好 发型飘逸穿着简单

形象设计师飞飞 浏览 19529

佟丽娅晒海滩美照 化身执灯少女超温柔

深剖娱乐圈 浏览 19958

女孩被篮球砸头后确诊癔症自残失禁 母亲:我也不理解

上游新闻 浏览 6723

菲总统马科斯访问越南,大米是焦点

环球网资讯 浏览 12710

俄乌导弹互攻进入战术新阶段

环球网资讯 浏览 12849

春天还是衬衫叠穿最好看 时髦又高级

小陈聊搭配 浏览 20206

独家对话招行行长王良

21金融圈 浏览 11406

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 977

媒体人:国足主帅应让中青年土帅担纲,说不定杀出一位霍去病

懂球帝 浏览 1649

刘涛女儿近照曝光,这才是“顶级富养”的典范!

动物奇奇怪怪 浏览 1002

郭晶晶晒全家滑雪照 与霍启刚合照超甜蜜!

笑猫说说 浏览 12870

特朗普改打感情牌承认中方非常强大 疑想北京再给机会

现代小青青慕慕 浏览 4336
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1