关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1670人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广州一小区2年抓到60多条蛇 业主:每天出门提心吊胆

极目新闻 浏览 4663

电影《头文字D》夏树近照曝光 颜值变化很大

映射生活的身影 浏览 13216

俄国际军事论坛计划展出俄军缴获的北约战利品

环球网资讯 浏览 15104

胡润百富榜发布!刘永行、朱义、刘永好、刘汉元、张勇排川商前五

红星资本局 浏览 786

中哈联合育种 助力哈萨克斯坦马铃薯增收

新华社 浏览 10997

商务部透露:我国汽车以旧换新提交补贴申请近2万份

智车情报局 浏览 10678

连续三个月“0破发”!1月新股上市首日平均涨84%

澎湃新闻 浏览 12418

大马丁入驻国内某平台,自我简介是“给世界冠军阿根廷看大门的”

直播吧 浏览 16301

东阿阿胶急需新舵手

斑马消费 浏览 19151

这个风格又火了 可以从20岁穿到70岁

LinkFashion 浏览 14960

户外品牌除了炸山就没有出路了吗?

诗与星空 浏览 860

降入20万价格区间 曝廉价版特斯拉即将国产

车质网 浏览 1034

《权力的游戏》牧羊人扮演者达伦·肯特去世

网易娱乐 浏览 15013

马斯克的X(推特)解雇了八成从事信任与安全工作的工程师

IT之家 浏览 12704

厦门银行拟发行50亿元可转债:资本充足率下降明显 近两年持续补充资本金

面包财经 浏览 19057

外卖救了全聚德?

BT财经 浏览 14656

尹锡悦调整统一部 称其为“对朝支援部”

环球网资讯 浏览 15403

马德兴:国足的压力来自场外因素,球员们在扭曲的心态下比赛

懂球帝 浏览 12843

一句话,干掉586亿

深蓝财经 浏览 1596

打工人龙年第一道坎,是抢不到春运回程票

刺猬公社 浏览 12461

美国向乌提供情报以瞄准俄境内目标?五角大楼回应

环球网资讯 浏览 19196
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1