关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4412人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被记者询问涉移民言论 德国总理回呛"问你们女儿去吧"

环球时报国际 浏览 11197

经典重构,法拉利SC40向F40致敬

爱驾天下 浏览 3589

245万的房子被中介私自标价170万挂牌 浙江业主怒了

FM93浙江交通之声 浏览 9658

法兰克福左后卫布朗:我们依靠整体防守萨拉赫,而不是我单防

懂球帝 浏览 3633

陈伟霆新剧《爱情慢慢》开机陷番位争议

梦在深巷qw 浏览 1668

蚂蚁集团首席执行官韩歆毅:以“数智普惠”惠及每一位老百姓

上游新闻 浏览 3367

字母哥首秀但他还走吗? 胜公牛并未让雄鹿宽心

仰卧撑FTUer 浏览 3866

开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!

雷峰网 浏览 2364

全新奥迪A6L实车:外观大变样轴距超3米,带智能辅助驾驶小蓝灯?

Nice好车 浏览 3812

“工装混搭风”今年爆火!全世界的时髦女人都在穿

LinkFashion 浏览 2393

女人过了40岁穿衣别老气横秋,看看这些日系穿搭,得体又显瘦

静儿时尚达人 浏览 3464

详解“和平意志-2026”演习各国参演舰艇阵容

环球网资讯 浏览 2650

动力系统升级 新款方程豹豹5谍照曝光

车质网 浏览 4513

懂穿搭的女人,把“卫衣”收进衣柜,这3件单品才是时髦密码

静儿时尚达人 浏览 3772

圣诞节,我想看这几部电影!

Yuki女人故事 浏览 2886

推广中奖名单-更新至2025年9月8日推广

黎贝卡的异想世界 浏览 5613

媒体:中国不惧美方施压 "偏逆着来"购买更多俄石油

澎湃新闻 浏览 11672

今日热点:《怪奇物语》番外动画剧预告;NEWBEAT签约摩登天空……

伊周潮流 浏览 2826

性压抑时代,搞黄色成了AI的第一生产力

虎嗅APP 浏览 2538

11国将承认巴勒斯坦国之际 美国追加60亿美元对以军售

界面新闻 浏览 21541

冲U17女足世界杯8强!中国VS巴西首发:更换2人 周欣怡、宋语领衔

我爱英超 浏览 3604
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1