关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3629人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

现场直击|神舟21号升空前6小时,带你沉浸式追火箭!

上观新闻 浏览 3558

22个州经济正在萎缩,消费者信心持续下跌,多家机构警告美国经济衰退

环球网资讯 浏览 3794

韩媒:韩国女足抗议足协只让男足坐商务舱,情况严重可能罢赛

懂球帝 浏览 3768

净利腰斩 “非洲之王”传音失速

北京商报 浏览 2423

新质生产力“可感可及”,华强北机器人展演月“硬核度”爆表

南方都市报 浏览 4281

太阳报:曼联预计未来几周官宣前往沙特踢季中赛

懂球帝 浏览 3423

美国副防长将访日 或要求日本提高防卫费

上观新闻 浏览 2548

乌方公布视频:无人机命中俄方两架安-26运输机

环球网资讯 浏览 3665

需求激增 流感药“新老对决”

北京商报 浏览 3295

伊能静没有代表作

江湖人称艾掌门 浏览 3848

北约和俄罗斯空中对峙升级 推高爆发军事冲突风险

澎湃新闻 浏览 4241

现场:马竞绝杀国米6连胜!甘当替补的格子同样出色

体坛周报 浏览 3254

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者 浏览 3445

巴特:如果马雷斯卡来执教曼联,我就把我的季票退掉

懂球帝 浏览 2739

牵手长安汽车,京东、宁德时代继续拓新

观察者网 浏览 3806

印度电动汽车市场:名爵份额逼近塔塔

车质网 浏览 3672

"斩首警告"后高市早苗骑虎难下 日本网民却集体破防

北回归线 浏览 31994

下辈子换我长郑恩彩这样好吗?

时尚COSMO 浏览 2868

新款比亚迪夏限时19.68万起售!上车天神之眼B激光版,支持城市NOA

车东西 浏览 2872

搭载鸿蒙座舱 新款天籁将于广州车展上市

车质网 浏览 3406

新角色?詹姆斯复出后或成湖人老三 变身加强版追梦更利好紫金军

罗说NBA 浏览 3614
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1