关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者807人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

NYU研究揭示:模型宽度与能力非线性相关

科技行者 浏览 786

还记得《老友记》吗?除了钱德勒他们都过得如何?

橘子娱乐 浏览 14144

逆天大瓜!孙楠和那英嘴对嘴亲吻!就是不知道对方的另一半怎么想

娱乐白名单 浏览 10818

媒体:秦刚正在欧洲访问 美国舆论顿时紧张起来

环球网资讯 浏览 18567

卢拉将率超大代表团访华 专家:他历来有友华情结

环球网资讯 浏览 19374

口碑爆棚,票房扑惨,最争议的大片来了

独立鱼 浏览 850

傅园慧再回应包车被勒索:还是很喜欢东北 下次还来

极目新闻 浏览 79295

武汉一警察牺牲 身中15刀仍下25级台阶紧追歹徒20米

极目新闻 浏览 68364

一文解读杨振宁的百年人生密码 曾与爱因斯坦做同事

北京日报客户端 浏览 3125

科技巨头再投500亿瞄准这个赛道

中国新闻周刊 浏览 707

国家安全机关破获美国中央情报局间谍案

国家安全部 浏览 84059

武汉不是疫情来源,世卫组织发布最新疫情溯源报告

趣看热点 浏览 1267818

男子被疑出轨,老婆在线求李若彤帮捉奸,本尊回复

盖饭娱乐官方号 浏览 18367

面向“年轻品味前行者”,启辰大V推出“年轻潮力量”

BusinessCar 浏览 20322

美国战争部长:特朗普吼了他 因其未完成某项任务

红星新闻 浏览 976

当美妆变成快消品,为何还需要一件“传家宝”?

时尚COSMO 浏览 1952

耶伦:美国经济已实现软着陆 悲观情绪是毫无依据的

财联社 浏览 73919

朝鲜智库:目前半岛紧张局势不亚于朝鲜战争爆发前夕

环球网资讯 浏览 86519

媒体:守卫巴赫穆特的乌军危在旦夕 结局很难预料

经济观察报 浏览 96970

远洋集团陷巨额亏损 员工:2大股东曾派调查组评估家底

红星新闻 浏览 88251

浙江一家三口全部过世 留下的百万遗产确定继承人了

每日经济新闻 浏览 90495
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1