关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3444人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

‍♂️吧友们抓紧了!国足主帅报名将于明天截止

直播吧 浏览 2963

特斯拉前全球销售主管爆猛料

电动知家 浏览 2086

吴佩慈发大S照片悼念:我失去的岂止是一个好朋友

素素娱乐 浏览 1383

陈妍希带娃现身海口,儿子小星星近状曝光,母子俩牵手同行好温馨

扒虾侃娱 浏览 2011

比亚迪10月销售441706辆 新能源累计销售超1420万辆

网易汽车 浏览 2488

爱德华兹像乔丹又实锤了? 火箭名宿:没人像乔丹但我喜欢华子

仰卧撑FTUer 浏览 2757

瓷器店里的蛮牛?非也! 兰博基尼在华20年成长路

网易汽车 浏览 2679

黄宗泽恭喜陈伟霆当爸,没想到隐藏那么深,怼记者做人别太八卦

扒虾侃娱 浏览 2686

不在乎中国市场?全智贤方风波后仍未道歉,昔日傲慢模样全被扒

扒虾侃娱 浏览 3383

阿拉维斯vs西班牙人:德尼斯-苏亚雷斯、阿莱尼亚首发,鲁文-桑切斯、基克-加西亚出战

懂球帝 浏览 2500

通过民间借贷获取大额回报,利用职务便利低买高卖房产......农行冯建龙被开除党籍

财通社 浏览 1449

纪录片《重返狼群》一夜间翻红 "狼王"格林目前无下落

新民周刊 浏览 18821

A股:再刷新历史纪录!

小白读财经 浏览 3480

「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声

新智元 浏览 2685

马斯克星链成缅甸电诈“利器”,美国会已启动调查

界面新闻 浏览 2808

50+女人别踩坑!远离紧身裤和老年装,这样穿优雅又显瘦

静儿时尚达人 浏览 2114

许绍雄患癌仍敬业!今年参演9部作品努力宣传剧集

萌神木木 浏览 2629

美媒:乌克兰向美国提交对最新“和平计划”的回复

澎湃新闻 浏览 2013

朱媛媛去世后辛柏青首露正脸,眼神空洞憔悴

胡一舸南游y 浏览 2540

首艘美国船被罚之际 特朗普调2艘航母部署中国周边

现代小青青慕慕 浏览 6283

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 2547
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1