关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12409人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛弹琴:特朗普迎最高兴一天 还求以方赦免内塔尼亚胡

映象网 浏览 4931

“毛衣+豆腐裤”绝美!冬天就该这么穿!

Yuki女人故事 浏览 751

美防长住进ICU五角大楼未及时通报 就连拜登都不知情

环球网资讯 浏览 73504

境外网友发图称福建舰甲板裂缝 美智库驳斥

环球网资讯 浏览 15940

疫苗为何打在胳膊而不是屁股上?打针一边可以分为四类

趣看热点 浏览 25520

90后小伙1家3口干瓦工日薪2000元 已经买车买房

极目新闻 浏览 77115

7天仅带货30多万,重启失败后,天涯创始人称最坏打算是卖掉天涯

每日人物 浏览 16509

泽连斯基的冬天:美乌军事策略似乎出现分歧

金羊网 浏览 13225

俄军总参谋长被传在袭击中阵亡 乌罕见否认

红星新闻 浏览 12918

每体:拉波尔塔、德科将出席贝肯鲍尔的追悼会

懂球帝 浏览 12484

ESPN:德容已与巴萨就续约达成协议,他的薪水将降低

懂球帝 浏览 1019

涉案近3千万的院长被抓后 该院人均就医成本降千余元

澎湃新闻 浏览 86272

外媒:俄军订购中国SUV当指挥车,还部署到了纳卡

环球军事时报 浏览 26795

德外长:支持向沙特出售欧洲战斗机

环球网资讯 浏览 12959

29岁女白领荒野求生半月瘦成"闪电":睡觉时放一把刀

都市快报橙柿互动 浏览 12193

4名解放军官兵在中印边境冲突中牺牲到底是怎么回事?

趣看热点 浏览 26444

谷歌间接承认 Tensor G5 芯片 GPU 问题

IT之家 浏览 838

红海航道危机,牵动全球供应链

环球时报国际 浏览 13010

宇树科技更名!正在办理工商变更,已完成首期上市辅导

红星资本局 浏览 868

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 664

伊姐周六热推:电视剧《余生有涯》;电视剧《猎豹》......

伊周潮流 浏览 1031
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1