关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12407人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

湖南这一夜,郭碧婷的“水桶腰大饼脸”,是对内娱畸形审美的反击

娱乐圈笔娱君 浏览 12721

泫雅大方认爱!官宣和大三岁男星龙俊亨恋情,晒出牵手照高调点赞

萌神木木 浏览 12833

"瓦格纳事件"后拜登首次发表讲话 称美国完全没有参与

环球网 浏览 18428

毛不易演唱会撒圆形纸钱,本人:这吉祥吗?

一家说 浏览 1533

比亚迪正式拿下财险牌照,全资接盘易安财险获批

界面新闻 浏览 17966

以色列防长与埃及防长就边境交火事件通电话

环球网资讯 浏览 16869

清华REMA框架:透视AI推理错误根源

科技行者 浏览 914

加强关键矿产资源保障 促新能源车产业发展

中国证券报 浏览 19274

疑华谊二公子袭警获刑 私照曝光为23岁美籍硕士

网易娱乐 浏览 26765

卡萨诺:有九名球员不配在尤文踢球,戴维糟糕到令人难以直视

懂球帝 浏览 882

人人都爱泡泡袖!遮肉又显瘦

In风尚 浏览 16842

玩换电,推增程,埃安到底要干什么

汽车公社 浏览 544

中国将翻拍忠犬八公,冯小刚等实力派影星助阵

趣看热点 浏览 26169

汽车图谱⑳|新能源车迎最强“金九” 新势力头部月销达4万量级

贝壳财经 浏览 1028

“金色眼镜蛇”军演美派出罕见兵力 美媒:意在中国

环球网资讯 浏览 19223

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 597

王健林限高措施已取消

YOUNG财经 浏览 1491

双红会3亿强援替补!维尔茨谢什科遭弃用,媒体人:斯洛特真大胆

奥拜尔 浏览 938

马国明透露将与汤洛雯在年底前结婚 自曝想生两个

网易娱乐 浏览 19730

应李强总理邀请 俄罗斯总理时隔半年多再次来华

北京日报客户端-长安街知事 浏览 74062

500Bar新蓝鲸 CS75PLUS智慧冠军版限时价9.19万元起

网易汽车 浏览 820
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1