关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者818人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国“空天飞机”成功着陆,它与美国X-37B有很大不同

环球网资讯 浏览 18114

冰点将至,小鹏汽车画出了一个“重生模型”

36氪 浏览 19569

历史上天才中的天才,你最佩服哪一位?

趣看热点 浏览 25971

乌高官声称“已将英国导弹用于打击俄腹地目标”

参考消息 浏览 10727

沈腾成票房第一演员,总票房190亿超越黄渤

趣看热点 浏览 26578

售28.99万起 凯迪拉克新CT6配置大升级

网易汽车 浏览 828

董卿母子现身看电影,13岁儿子身高超160

娱乐圈圈圆 浏览 264

金融业排第二!2022年平均工资出炉,这个行业最高

中国基金报 浏览 18467

NBA球员有哪些不为人知的副业?

趣看热点 浏览 25855

台海巡艇被目击与大陆海警船"并行"

环球网资讯 浏览 12347

✔️✔️联手C罗!多家沙特媒体证实利雅得胜利成功签B罗

直播吧 浏览 15477

马斯克:我更喜欢磷酸铁锂电池 可充电到100%

盖世汽车 浏览 20280

马拉加71-61击败NBA发展联盟联队!卫冕国际篮联洲际杯冠军!

直播吧 浏览 1579

泽连斯基:与美国的谈判并不容易

新华社 浏览 74

媒体:美国最新一轮对台军售不同以往 中方将进行反制

政知新媒体 浏览 73133

汪小菲晒儿子正面照

古希腊掌管月桂的神 浏览 1064

才发现“打底裤”居然这么时髦!掌握这3点精髓,谁穿谁好看

静儿时尚达人 浏览 13201

即将重新服役的俄军航母 正面临"更严酷的挑战"

枢密院十号 浏览 19033

国内十大城市哪些新能源车卖得最好?问界M7夺多个冠军

智车情报局 浏览 12276

外媒发布本田全新一代2027款思域预想图,比以往更高级!

老爷车 浏览 1484

头皮分泌油脂过多?建议尝试这5种改善方法

医说健康 浏览 18688
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1