关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1661人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

富士康汽车代工失利,被申请破产保护的美国造车新势力起诉

界面新闻 浏览 15585

台军"自造"潜艇首次对外展示全貌 距离服役尚有时日

环球网资讯 浏览 12523

俄无人机救下一名正遭乌军性侵女子 顾不上提裤子拔腿就逃

大象新闻 浏览 1011

马拉加71-61击败NBA发展联盟联队!卫冕国际篮联洲际杯冠军!

直播吧 浏览 1580

闪电快讯 | 享界S9T售价30.98万元起 上市24小时大定超过7500辆

电厂 浏览 1686

媒体:拜登说漏了?美国有毁灭台湾计划?

环球网资讯 浏览 19136

早春第一条裙子这样搭,显瘦显高还不挑人!

她暖 浏览 19769

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 625

亚马逊据悉要求员工迁址办公

界面新闻 浏览 14173

应对欧盟关税压力?雷诺将与宁德时代、LG合作研发电池

观察者网 浏览 10648

媒体:被昔日学生中国超越 欧洲落于人后的悲观正蔓延

澎湃新闻 浏览 1835

AI设计出可杀灭细菌的功能性病毒,专家呼吁谨慎推进

IT之家 浏览 1683

13.72万元起,2024款吉利星越L新增车型上市

天天汽车 浏览 12426

水花兄弟!库里克莱包办勇士末节29分中的22分

直播吧 浏览 13056

用户称地震时7部苹果手机均无预警,客服回应了

每日经济新闻 浏览 12892

坚持10年做这件小事,我收获了太多

黎贝卡的异想世界 浏览 923

赵丽颖剪短发穿"人鱼姬"礼服 变换风格更美了

时尚丽人风行 浏览 18861

迪马:佛罗伦萨想租借30岁罗马前锋贝洛蒂,球员已同意加盟

直播吧 浏览 12467

冬季穿衣别太过于单薄,看看这些大衣和羽绒服,保暖简约百搭

静儿时尚达人 浏览 80

事关国家和你我,安全、安全还是安全!

牛弹琴 浏览 14603

华为很急,等不起赛力斯

金角财经 浏览 15893
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1