关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者1425人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北约和俄罗斯空中对峙升级 推高爆发军事冲突风险

澎湃新闻 浏览 3269

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 2793

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 2767

耗时3000小时 近40万美元拿下完美修复的路虎卫士

CLauto酷乐汽车 浏览 1550

伊朗革命卫队呼吁为真主党领导人被杀“复仇”

参考消息 浏览 2205

ImageNet分数越高,生成反而越糊?iREPA给出解释

新智元 浏览 1919

马力破千匹 宝马纯电M3官方谍照发布

车质网 浏览 1543

鲁内跟腱断裂后,弗里茨等球员控诉ATP不顾球员死活!

网球之家 浏览 2769

世体:皇马今天在雨中训练,阿拉巴、卡瓦哈尔和吕迪格依然缺席

懂球帝 浏览 2678

尤文啃下硬骨头 斯帕莱蒂拿到“最重要的胜利”

体坛周报 浏览 1976

这届大美人,怎么入冬撞衫率100%

时尚COSMO 浏览 2159

外交部回应"APEC会议期间中美元首是否举行会晤"

界面新闻 浏览 7060

广东三外配置太完美!奎因萨姆纳双能卫猛攻,萨林杰关键球收割!

篮球资讯达人 浏览 1715

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 2094

特朗普转发针对古巴强硬言论:鲁比奥将成"古巴总统"

环球时报国际 浏览 11089

未来四个月,汽车市场的目标增速-11.82%?

DearAuto 浏览 3504

可可成本大增 亿滋国际承压

北京商报 浏览 2500

萧美琴在欧洲议会大楼参加会议并讲话 外交部回应

澎湃新闻 浏览 7777

妈妈辈也能轻松穿出高级感:3个实用穿搭法则,优雅不费力

静儿时尚达人 浏览 2597

安切洛蒂:现在出现问题并及时修正,总比在世界杯时出错要好

懂球帝 浏览 2990

明天会更一部灵异类电影,那就找几张鬼里鬼气的壁纸,大家收图

电影最TOP 浏览 2232
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1