关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1685人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

欧洲将研发高超音速武器拦截系统

参考消息 浏览 15417

印巴空战0:6惨败后,印度空军的“空优”梦碎

浏览 4826

西足协主席谈亚马尔:本应处理得更好,重要的是照顾好球员

懂球帝 浏览 621

北京传媒大学和微软团队破解云端智能压缩难题

科技行者 浏览 873

全球1~8月电池装机量,韩系继续败退

汽车公社 浏览 928

遭吹杨穿裆戏耍后单打利拉德找回场子,杜兰特12中7贡献18分

懂球帝 浏览 12072

民宿订单暴涨748%!哈尔滨实火

21世纪经济报道 浏览 12557

当中国出口全看汽车 你是喜欢哭来还是喜欢笑?

水皮M0RE 浏览 16444

清华姚班大神陈立杰,联手00后逆向破局!颠覆50年计算机难题

新智元 浏览 270

爆破试验带你看巡飞弹飞龙-60A有多强

环球网资讯 浏览 1599

关于生成式AI,这三个问题很关键

经济观察网 浏览 804

21岁美“泄密门”主角庭审全程表现安静

环球网 浏览 19062

AI大战打到太空!前脚H100入轨,TPU后脚上天,中国玩家笑而不语

量子位 浏览 738

中国女子赴美见男网友失联 女儿担心其遇到"可怕的事"

新民周刊 浏览 86530

王一博耐克终止合作,坚决维护祖国利益

趣看热点 浏览 25782

新能源汽车第一城宣布:最高补贴8000元

21财闻汇 浏览 11008

惨!周星驰电影5天票房仅86万,时代抛弃你时,连句再见都不会说

娱乐圈笔娱君 浏览 91

古代帝王皇族们为什么都喜欢围猎?真不是因为馋野味

趣看热点 浏览 26528

最牛退休女工,靠卖易拉罐,纳税100亿

创业家 浏览 1003

年薪超百万,京东开始挖汽车人!

电动知家 浏览 983

iPhone 15 Pro机型有望配8GB内存,标准机型内存升至LPDDR5规格

IT之家 浏览 19212
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1