关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4414人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小李子携27岁意大利女友首次亮相奥斯卡颁奖礼

时光在作祟 浏览 1672

日媒:中国呼吁公民暂缓赴日的措施 超出了日本预期

扬子晚报 浏览 43962

TA:阿莫林对3-4-3的执念,从一开始就注定了他在曼联的失败

懂球帝 浏览 2692

净利润暴增503倍!310亿“零食大王”,冲刺港股IPO

侃见财经 浏览 3802

NVIDIA 向英特尔投资 50 亿美元 共同开发 AI 基础设施和个人计算产品

经济观察报 浏览 4460

内维尔:B费的表现就像坎通纳;曼联的表现体现了球队的DNA

懂球帝 浏览 2628

今年秋天最流行的风衣,“短一点”才时髦!

LinkFashion 浏览 2946

著名音乐人何厚华英年早逝:终生未婚

历来纵横 浏览 4196

德云社张鹤伦凌雾天唱歌,好惬意

细语 浏览 3697

欧莱雅中国升级“一代耀一代”科技女生赋能计划

中国新闻周刊 浏览 504

上海百万平方米AI小镇全球亮相!20亿元创业基金虚位以待

上观新闻 浏览 4465

拉什福德渴望永久转会愿大幅降薪!暗讽曼联,称巴萨让他重获新生

罗米的曼联博客 浏览 3727

千问APP发起春节攻势 30亿请全国人民吃喝玩乐

雷峰网 浏览 2446

AMD也要减少GPU供应!重点转向RX 9070 XT:价格更好调整

快科技 浏览 2572

双电机还不够?三电机都来了 新款阿维塔12申报图曝光

网易汽车 浏览 2703

追觅进入剃须刀市场推出首款产品“小胶囊S7 Pro”

IT之家 浏览 3823

掌舵第二年扭亏!天齐锂业蒋安琪:重心放国内,优质锂资源开发刻不容缓

时代周报 浏览 1151

更年轻化 新款丰田卡罗拉将于12月21日上市

车质网 浏览 2999

道指重挫800点,IBM跌超13%,白银期货涨超7%,加密货币超16万人爆仓

21世纪经济报道 浏览 2029

每体:多家俱乐部提出租借巴尔德吉,弗里克暂时希望他留队

懂球帝 浏览 3540

三年打入越南Top 5,这家纸巾厂的出海秘诀是什么?

虎嗅APP 浏览 3729
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1