关闭广告

英伟达H100杀疯了:11分钟训完GPT-3,霸榜8项测试

量子位11932人阅读

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

11分钟内训练一遍GPT-3,8秒训完BERT

这就是英伟达给AI圈的一点“小小震撼”。

在最新MLPerf训练基准测试中,英伟达H100集群,横扫八项测试,全部创下新纪录,并且在大语言模型任务中表现尤为突出!



在大语言模型任务中,H100集群的加速性能逼近线性增长

即随着集群处理器数量增加,加速效果也几乎同比增加。

这意味着在集群内GPU之间的通信效率非常高。



除此之外,H100还完成了推荐算法、CV、医学图像识别以及语音识别等任务,是唯一一个参加8项测试的集群。

而在算力就是生产力的时代下,这波成绩意味着什么,懂得都懂。



据悉,本次测试系统由英伟达和Inflection AI联合开发,在云厂商CoreWeave上托管。

单节点性能增长明显

这次MLPerf Training v3.0中增加了两项新任务:

  • 大语言模型(基于GPT-3)
  • 推荐算法

这意味着测试任务包含了更大的数据集和更先进的模型。



如上刷新各项记录的,是由3584块H100组成的超大集群。

它的具体成绩如下:



这是本轮测试中,英伟达拿出的最大集群。

实际上他们还提交了一个包含768块H100的集群进行测试,并分别在云上和本地部署。

结果显示二者性能几乎完全相同。

更进一步还论证了随着集群中显卡数量的增加,其性能提升可以接近线性增长。



(NVIDIA Pre-Eos为本地部署,NVIDIA+CoreWeave为云上部署)

除此之外,这轮测试中英伟达还刷新了单节点加速记录。

和6个月前MLPef Training v2.1的数据比较,单个DGX H100系统(8块H100组成)在各项任务中平均提速17%。

和A100 Tensor Core GPU相比,最高能提速3.1倍(BERT任务)。



这些加速效果的实现,主要得益于两个方面。

一方面是H100本身就足够强悍

H100基于最新Hopper架构,采用台积电4nm工艺,集成800亿个晶体管,较A100增加了260亿个。

内核数量达到前所未有的16896个,是A100的2.5倍。

由于面向AI计算,H100中专门搭载了Transformer Engine,让大模型训练速度可直接×6

另一方面则是依赖集群内的加速网络。

这里使用的是英伟达Quantum-2 InfiniBand网络,是该网络架构的第七代。

官网介绍,加速网络能够提供软件定义网络、网络内计算、性能隔离、优越加速引擎、RDMA和最快达400Gb/s的安全加速。

据悉,共有90个系统参与最新一轮测试,其中82个使用了英伟达的GPU,英特尔方面有7个系统参与。

英特尔的加速系统使用了64-96 Intel Xeon Platinum 8380处理器和256-389 Intel Habana Gaudi2加速器。

其高配系统完成LLM的训练时间为311分钟。



基于这次报告的测试结果,有分析师表示他感受到的最大震撼不是H100本身的性能,而是在云上训练AI实现的卓越效果。

那么这次和英伟达合作的云厂商CoreWeave是谁?联合开发系统Inflection AI又来者何人?

计算集群还会进一步扩大

首先来看CoreWeave



它成立于2017年,是一家大型云厂商,号称提供业内最快、最灵活的大规模GPU计算资源,提供渲染、机器学习等云上方案,速度比大型公共云快35倍,成本低80%。

而这家云厂商很受科技巨头青睐,英伟达在此之前没少cue过它。

5月,CoreWeave拿下2亿美元融资,主要来自对冲基金Magnetar Capital,B轮总融资额达到4.21亿美元。

6月,有消息称微软与CoreWeave签署AI算力协议,用于计算基础设施,未来数年内的投资金额可能数十亿美元。

英伟达也向CoreWeave投资了1亿美元,4月时它的估值为20亿美元。

另一家AI初创公司Inflection AI由DeepMind创始成员穆斯塔法·苏莱曼(Mustafa Suleyman)等人创立。



这家公司成立于22年3月,已拿下2.25亿美元融资,估值超12亿美元。

公司已经开发出了一个大语言模型Pi,正是在H100集群上训练出来的。

据了解,Pi的定位是帮助人类更好和计算机交互,它能通过聊天内容来逐渐了解用户,然后提供更加个性化的回答,类似于个人智能管家的感觉。

Inflection AI的最新Blog里表示,基于目前的合作,他们计划在未来几个月内进一步扩大底层计算基础设施的规模。

参考链接:
[1]https://blogs.nvidia.com/blog/2023/06/27/generative-ai-debut-mlperf/?continueFlag=685ee2dc8db6455efed731baa85e2741
[2]https://developer.nvidia.com/blog/breaking-mlperf-training-records-with-nvidia-h100-gpus/
[3]https://www.forbes.com/sites/stevemcdowell/2023/06/27/nvidia-h100-dominates-new-mlperf-v30-benchmark-results/?sh=62b226c35e99

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

米体:米兰今夏本想租借戴维带最终失败 已将他视为明年首选目标

直播吧 浏览 10367

开春后不一定穿卫衣!这些单品时髦显气质,单穿、叠穿都可以

静儿时尚达人 浏览 7276

火力全开!杰伦-布朗23中15&三分12中6 砍全队第二高36分另8板3助

直播吧 浏览 8499

“中国能够轻松切断供应,我们该怎么办?”

观察者网 浏览 10573

光伏赛道步入分水岭 行业翘楚如何化危机为机遇

投资者网 浏览 8888

两家房企“面退”倒计时 这些公司也提示退市风险

证券时报e公司 浏览 12803

外媒:拜登声称如获通过会签署针对TikTok法案,特朗普则反对禁令

环球网资讯 浏览 8476

薪资专家:火箭还能大洛和狄龙二选一 RJ:得大洛火箭能进季后赛

直播吧 浏览 11662

天价车祸 法拉利恩佐德国高速遭遇重大事故 二手价超千万元

智车情报局 浏览 8292

巴西新冠疫苗志愿者死因是自杀死亡事件与疫苗本身无关

趣看热点 浏览 21642

美媒炒作“中国在古巴建间谍基地”古巴美国回应

环球网资讯 浏览 12862

突遭暂缓!实控人曾巨额行贿200万!又是海通证券保荐

财通社 浏览 11549

牛年最大规模雨雪天气来袭,超20省份将受到影响

趣看热点 浏览 111447

十年唱吧,一声叹息,转战VR,胜算几何?

连线Insight 浏览 12380

慈禧有4大怪癖前面3个让人傻眼最后1个”要人命”

趣看热点 浏览 21767

苏宁银行改名苏商银行后,有什么变化

湘财Plus 浏览 7048

台湾岛内开始抓内鬼,菠萝卖不出去都怪有人泄露种植技术!

趣看热点 浏览 346635

人到中年不油腻的秘诀,试试这些低饱和度的穿搭,优雅简约又好看

Yuki时尚酱 浏览 8888

胡塞到底打中美航母了吗?俄罗斯可以放心干!

浏览 7114

注册资本145亿!合肥跑出一家“核聚变”独角兽

科创板日报 浏览 6927

夏天穿衣主打简约清爽 24套搭配舒服还减龄

七柒时尚笔记 浏览 11593
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1