关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2614人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

沃什被提名次日 特朗普:不降息就把他告到裤子都不剩

极目新闻 浏览 8943

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 2642

比变老更可怕的是不会穿!中年女人掌握4个技巧,优雅不费力

静儿时尚达人 浏览 2678

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 3742

12306又上新功能:坐火车能领取积分 积分可以当钱花

大象新闻 浏览 8327

ACEMAGIC阿迈奇预告M1A PRO+迷你主机,搭载锐龙AI Max+ 395

IT之家 浏览 3112

造车新势力,重要时刻!

中国基金报 浏览 2714

尹同跃宣告奇瑞AI进入2.0时代,要快速追赶特斯拉FSD

贝壳财经 浏览 2579

戴墨镜出席达沃斯会议后 马克龙的支持率提升

参考消息 浏览 6473

意媒:罗马正在评估引进斯特林的可行性,可能提出租借方案

懂球帝 浏览 2507

诺丁汉森林公布扩建主场计划,将把主场扩建到52000座

懂球帝 浏览 2883

baby近照脸好僵!被质疑打针了没恢复,37岁了又拍网红照太心酸

萌神木木 浏览 216

央视点名!这5位艺人现原形?

君笙的拂兮 浏览 3660

王传福:全世界NO.1的卷王

燃擎频道 浏览 2564

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 3744

这件衣服今年太火了!时髦女人都在穿

LinkFashion 浏览 3555

5战全胜!文班亚马17+12+4帽马刺29分大胜步行者 7人上双制胜

醉卧浮生 浏览 3707

李小鹏女儿14岁奥莉近照刷屏!真是女大十八变

今古深日报 浏览 753

英媒:意甲俱乐部在关注拉斯金,热刺和狼队也对其感兴趣

懂球帝 浏览 3316

最高补贴1.5万元!深蓝、小米、蔚来等车企“兜底”新能源车购置税差额

红星资本局 浏览 3630

帽子选对,风格翻倍!冬日造型点睛术

Yuki女人故事 浏览 2540
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1