关闭广告

字节大模型策略:自研加平台

晚点LatePost11675人阅读



这周,字节跳动旗下云计算服务火山引擎推出方舟大模型平台,引入了智谱 AI、MiniMax 等 7 家创业公司 / 研究机构的大模型,对外出售服务。相关公司和机构在火山引擎活动会场开设展台,创始人或联合创始人到场宣布未来会和火山引擎有更深入的合作。

为了吸引创业公司把模型放在火山引擎上,字节跳动把抖音等业务的空闲计算资源极速调度给火山引擎,并比同行更低的价格出售算力服务。火山引擎总裁谭待说中国大多数大模型公司都用火山引擎训练,在火山引擎上做推理也顺理成章。

今年初,为了抓住人工智能大模型的机会,字节跳动组建了至少三个团队开发大模型,找英伟达下单超 10 亿美元的 GPU,两年前卸任 CEO 的创始人张一鸣也开始看相关论文,与一些团队交流心得。

投入大量资源的字节跳动,目标不只是像 OpenAI 那样开发出大模型,还希望凭借丰富的 GPU 储备建立一个平台,作为中间商帮创业公司训练、出售大模型。

按照谭待的说法,他们将来还会引入更多大模型,字节跳动自研的大模型,除了应用到业务中,也会放在平台里对外销售。他说这么做基于两个判断:大模型市场不会出现少数几个大模型通吃的局面、企业会用多个模型开发应用或改造业务。

“超级大模型效果好,性价比不高,不是所有问题都需要超级模型”,谭待接受采访时说,再加上不同行业解决问题不同,模型训练数据也不一样,因此会有针对特定行业或者不同参数量(决定成本)的大模型存在。

大模型是中国云计算公司的机会已经形成行业共识。但它们抓机会的方式有差别——百度和阿里都是先自研大模型,然后对外提供服务。腾讯现在还没有发布自研模型,马化腾说 “不急于一时”,腾讯先做的是建立平台,吸引行业方向的大模型进驻,对外提供服务。(贺乾明)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年春天女发流行这样剪 清爽又好看

镜子发型 浏览 15402

众星时装周路透:张嘉倪瘦脱相,刘涛低调素颜

盖饭娱乐官方号 浏览 15171

中国驻韩大使:现在赌中国输的人 今后一定会后悔

环球网资讯 浏览 71930

再反转:21℃室温超导成果被美院士宣称复现!新实验基于原始样品

量子位 浏览 12397

这次,换歪果仁特种兵一下!

时尚COSMO 浏览 6852

巴黎高定秀 | 100套绝美礼服,一场看不够的时尚盛宴

LinkFashion 浏览 6758

小米官方下场辟谣:网传售价为假

21世纪经济报道 浏览 8894

戛纳影节官方展映排片公布 《燃冬》5月21日首映

网易娱乐 浏览 15054

媒体:中国的两个邻国政局在同一天发生重大变动

北京日报客户端 浏览 10792

昆明市长、泉州副市长跑马拉松爆火 二人毕业于清北

南方都市报 浏览 54574

房东否认李湘主动打扫后退租到底是怎么回事?

趣看热点 浏览 22565

“董宇辉”,被转让!

半岛晨报 浏览 8278

鹅厂机器狗:学完真狗子的运动数据,真有二哈那感觉了

量子位 浏览 12273

陈妍希携子现身机场 6岁小星星扮酷

娱絮 浏览 10716

泽连斯基:俄乌停火只会让俄方受益

财联社 浏览 8698

拜登:英美空袭也门胡塞武装系回应其袭击国际船只

界面新闻 浏览 8714

媒体:今日外长记者会创多个"首次" 秦刚展现"立体感"

直新闻 浏览 79360

Uber称正与特斯拉合作 购买Model 3/Y将最高补贴司机2000美元

网易科技报道 浏览 8703

巴黎时装周 | Hermès 2024 春夏,轻盈流转

时装男士杂志 浏览 11811

一次吸毒终身禁演?人大代表提议严厉整治明星涉毒乱象

趣看热点 浏览 289956

美舰穿航台湾海峡东部战区回应了什么?到底是怎么回事?

趣看热点 浏览 191926
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1