关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12422人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这件衣服今年太火了!时髦女人都在穿

LinkFashion 浏览 859

特斯拉上海超级工厂或扩建 产能有望进一步提升

网易科技报道 浏览 26299

成立不久的中央领导小组 再有两名重要成员亮相

政知新媒体 浏览 89089

努涅斯赛后和队友调侃自己不进球:兄弟啊,球就是不想进

直播吧 浏览 12597

香港上市公司董事薪酬榜:李想6.8亿港元居首,布鲁可创始人朱伟松排第六

红星资本局 浏览 1051

机构:预计2024年全球AI服务器将超160万台,同比增长40%

界面新闻 浏览 12449

黄金大牛市突至:有人变现几百万

经济观察报 浏览 12444

好像记错了阿泰:2004年MVP投票排第6是我生涯最高光

直播吧 浏览 14383

定位大型SUV 腾势N8L将于10月28日上市

车质网 浏览 835

男篮真领袖出炉:李凯尔鼓励周琦一幕曝光 拍肩膀耳语大魔王服了

厝边人侃体育 浏览 14492

法媒:吉达国民即将报价马赫雷斯,但提供1亿欧合同是错误的说法

直播吧 浏览 16241

低能耗+大空间,奇瑞风云A8正式上市

天天汽车 浏览 12835

被问及美方是否寻求逮捕普里戈任 美国务院回应

每日经济新闻 浏览 87057

爆冷!莫布利29+8骑士崩盘输猛龙 巴特尔三分6中6引3人20+

醉卧浮生 浏览 726

复旦留美博士流浪街头曾有过4年婚姻 疑对家人有怨恨

上观新闻 浏览 74873

2023秋冬五大流行趋势 属于新时代女性的时髦

LinkFashion 浏览 16076

1314公里0接管,余承东亲测“全国都能开”,华为智驾真能脱手?

二师兄玩车 浏览 12404

英国以"支持俄对乌战争"为由制裁3家中企 中方回应

中国驻英国大使馆 浏览 12617

刚被爆的丑闻就靠怀孕压下来了?

新氧 浏览 15605

向佐一家四口逛迪士尼,郭碧婷坐儿童推车太搞笑

倩倩生日 浏览 12802

再见美拉德,今年流行的“新高智风”时髦又高级!

LinkFashion 浏览 880
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1