关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4409人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

换装纯电动力系统 全新日产JUKE谍照曝光

车质网 浏览 2794

帮助中国人撤离的伊朗民众:我们走不了的

南方都市报 浏览 1951

特朗普:我100%会加税 欧洲等着吧

澎湃新闻 浏览 11604

今年靴子怎么穿?这个思路可以解决一半冬日搭配

黎贝卡的异想世界 浏览 3057

34年来首次 普京下令起草恢复核武器试验提议

红星新闻 浏览 3384

合资巨头挥起价格屠刀,2026年车市谁主沉浮?

禾颜阅车 浏览 1677

无人驾驶获《时代》2025最佳发明奖:萝卜快跑、谷歌、特斯拉全球竞速

上观新闻 浏览 3862

美国进逼委内瑞拉 分析人士:已突破国际法的危险界限

上观新闻 浏览 3475

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 3029

八位堂推出“任天堂 NES 游戏机 40 周年”主体限定外设硬件

IT之家 浏览 3815

抄底许家印,截胡王健林,这个湖北出来的80后为什么能登顶巅峰?

时评人李文君 浏览 214

《731》票房破4.1亿,豆瓣却差评如潮,终于理解吴京这段话

娱乐圈笔娱君 浏览 4474

十年前,我们万万想不到

牛弹琴 浏览 2848

拯救“衰老”,这么护肤才有效率!

时尚COSMO 浏览 2223

泰柬新一轮边境冲突持续一周 数十万人逃离家园

北青网-北京青年报 浏览 2977

记者:西汉姆起初为帕奎塔标价6000万欧,球员也帮助促成降价

懂球帝 浏览 2429

赵丽颖直播太实诚,被问儿子暖还是羊绒暖,赵丽颖果断选择儿子

扒虾侃娱 浏览 3735

细节调整 新款享界S9纯电版申报图曝光

车质网 浏览 3881

媒体:美伊冲突似要再起 美军机在波斯湾遭遇紧急情况

新民晚报 浏览 13382

NVIDIA研究团队打造"思考-表达"双模式AI

科技行者 浏览 2533

张兰小玥儿成都公园亲密散步,玥儿举止略显拘束

小娱乐悠悠 浏览 3522
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1