关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3627人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年春夏“短上衣+阔腿裤”太流行了,这样穿时髦又显高!

LinkFashion 浏览 466

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 4052

日供低至23元!车市开年遇冷,车企打响“金融战”

国际金融报 浏览 2427

生育津贴直接发放至个人 这些地方已实现

央视财经 浏览 3690

天籁出新款,鸿蒙座舱+燃油车,合资新出路来了?

Nice好车 浏览 4332

3人救落水女子4人均遇难 救援人员:水情复杂还有旋涡

极目新闻 浏览 58930

智平方发布模块化具身智能服务空间“智魔方”,计划3年落地1000个

澎湃新闻 浏览 2895

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 9782

北京拿下“五万亿之城”,为何还成了AI之城?

BT财经 浏览 2038

印度电动汽车市场:名爵份额逼近塔塔

车质网 浏览 3671

凯恩:若卡尔继续表现出色,他绝对有机会为德国队踢世界杯

懂球帝 浏览 3569

C罗再谈曼联:架构出错阿莫林无法创奇迹,为此难过希望尽快复兴

罗米的曼联博客 浏览 3514

ChatGPT要有广告了?消息称ChatGPT安卓测试版现广告代码

环球网资讯 浏览 3092

乌克兰决定与尼加拉瓜断交

参考消息 浏览 2884

周末两大利空!科技股被一致看空,国常会、证监会重磅

看财经show 浏览 3457

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 13237

四部门召开动力及储能电池行业企业座谈会:规范价格竞争

界面新闻 浏览 1004

刘晓庆严正否认男友及北京去世等不实传闻

晓肂爱八卦 浏览 2359

武契奇预测:48小时内伊朗遇袭

极目新闻 浏览 8974

小鹏将推出长途增程混合动力X9,单次续航1600公里

MOTO 浏览 4539

今年电动汽车销量将创六年来最慢增速

大象新闻 浏览 2693
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1