爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

全新宝马X5...

国米取胜后距...

美国11月I...

周杰伦热捧韩...

鸣鸣很忙明天...

19岁女孩留...

宁德联手紫金，打得过王传福和他挖矿的表哥吗？

央视一姐董卿“陨落”！51岁的她成于自己

聚焦进博｜一个巴西律师的“新上海故事”

＂希腊船王＂继承人战胜癌症被虫子咬一口莫名其妙死了

美特使被指教俄外交官＂吹捧＂特朗普美媒披露通话记录

网红小狗靠捡瓶子攒了10万元疑被＂毒狗团伙＂盯上

奇瑞瑞虎9家族全面上市抢鲜价12.79万起

E句话| 恭喜，他们生三娃了！

坦克400预售：新增激光雷达，支持高阶辅助驾驶

菲戈和伊尔迪兹获2025地中海卓越奖，颁奖典礼于10月20日进行

内维尔：B费的表现就像坎通纳；曼联的表现体现了球队的DNA

重庆女孩不会杀猪上千网友驱车帮忙有人白送9头活猪

美国政府进入史上＂停摆＂最长时间特朗普表态

蔚来多款车型推出电池月租付一赠一限时优惠

消息称小鹏今年将推G01等4款新车，冲击55万-60万销量目标

不造车，京东谋何局？

推广|| 被低估的百元级国货！推荐你们趁好价试试

政务大模型部署，重磅文件印发

社评｜立足新起点奋力开新局

加斯佩里尼：意甲争冠？我知道有一些实力更强的球队

离婚真相曝光不到2月，“一言不发”的唐嫣，给娱乐圈上了一课

3座中资港口遭明抢！中美港口博弈，中方的底牌有多大？

沃什任命恐推迟？特朗普政府请求法官重新考虑撤销对鲍威尔传票的决定

曹德旺辞去福耀玻璃董事长职务，儿子曹晖接任