爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

黄晓明：肉白...

博时基金“换...

金银同创历史...

中信银行开年...

北约举行一年...

英伟达开始在...

邮报：利物浦等队密切关注塞门约，伯恩茅斯估价超7500万镑

中企派2000名工人赴欧洲建厂英媒还在存心挑拨

图卢兹vs梅斯：雷斯特、西迪贝首发，巴洛-图雷、哈比卜-迪亚洛出战

女子发现前夫用其就诊卡开上千片精神类药物医院回应

苏超，明年有新变化！省政府再做部署！

CES 2026成为“中国科技秀”，AI硬件场景化提速

中马智库机构在吉隆坡举行交流座谈探讨区域研究与合作

傍上 “新中式”，现制酸奶能迎来 “二次爆发” 吗？

老派，但是好看

全身爱马仕的马筱梅生完孩子却穿三百块套装

上海团队让人人都能当＂数字城市建造师＂

拥抱AI 沃尔玛跻身“万亿美元俱乐部”

百度的AI叙事，刚刚开始

58岁侯勇老来得子！携小20岁三婚妻子亮相澳门

智元新增人形机器人生产订单超万台，具身本体路线还能卷多久？ | 独家

主打运动与智能零跑Lafa5内饰首发亮相

巴西前国脚埃默松-莱昂：内马尔无法成为任何人的榜样

黎巴嫩总统谴责以军空袭贝鲁特

24架F-35A隐身战机集结西太平洋

普京：某国准备进行核试验

尼日利亚主帅：民主刚果在点球大战时使用巫师做法，胜之不武

今年冬天最火搭配：毛衣+毛衣，放松穿更好看！

澳大利亚刚插手台海就收噩耗中方杀鸡儆猴停特殊待遇

首富卷入惊天丑闻，妻子被瞒一无所知