关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12408人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

那个被纪梵希炒掉的“大妈”,却在优衣库封神了

InsDaily 浏览 15201

C罗加冕射手王,助尤文拿下意大利超级杯冠军

趣看热点 浏览 25479

续航380km,全新大众Transporter纯电版谍照曝光

天天汽车 浏览 12604

卓正医疗通过IPO备案:年营收6.9亿 腾讯与H Capital是股东

雷递 浏览 1707

特朗普发布“致命打击”画面 委内瑞拉:美国不宣而战

上观新闻 浏览 1621

微信官方致歉:将继续优化与高校的沟通流程,加强合作

第一财经资讯 浏览 15999

俄将讨论批准从远东线路向中国供气的法律草案

环球网资讯 浏览 18457

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

新智元 浏览 1094

联合国官员:加沙地带海上人道主义走廊短时间内难起效

极目新闻 浏览 12166

女网红拉姆被前夫烧伤细节曝光,汽油直接淋遍其全身

趣看热点 浏览 26706

预售10.29万起 BJ30旅行家将于9月27日上市

车质网 浏览 1686

经济日报:发挥政府投资基金“撬动”作用

经济日报 浏览 14561

法官:牟林翰辱骂与受害人自杀存在刑法上的因果关系

京法网事 浏览 91674

E句话 | 为什么没回去当教练?郭晶晶的回答很坦诚

仙女事件簿 浏览 10821

58岁女子因1碗米粉和丈夫分房 丈夫想碰她一下都不行

社会奇闻君 浏览 115379

消息人士透露耶伦计划7月初访问北京 外交部回应

环球网 浏览 88498

阿萨德垮台,谁将掌权叙利亚?

浏览 23193

中国公民需谨慎前往日本 四大原因披露

环球网资讯 浏览 39875

汽车降价潮调查:政府补贴含金量高,车企让利并不多

红星资本局 浏览 18985

赌王长孙女近况曝光,定居澳门买下2300平海景房,悲惨人生终逆袭

萌神木木 浏览 906

帕多瓦诺:我为图多尔感到遗憾;让我选新帅绝对是曼奇尼

懂球帝 浏览 762
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1