关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者3621人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

竟然人VS居然人,这是什么新标签?

时尚COSMO 浏览 3074

郭芙蓉自由了,我却还留在同福客栈

时尚COSMO 浏览 2024

6000万贱卖总部大楼,“中国催收大王”也被催收了…

深蓝财经 浏览 2958

吃相难看!史晓燕曝何晴离婚有隐情,力挺许亚军

収起了底线 浏览 2971

一旦安世半导体分裂,最后谁会哭?

禾颜阅车 浏览 3596

杭州银行年薪252万副行长获提拔,行长空缺大半年后终于敲定

湘财Plus 浏览 2748

福建舰更多细节公布 一组动图全方位看清楚

央视新闻客户端 浏览 2677

特朗普施压伊朗:美军舰队规模比在委内瑞拉的还大

大风新闻 浏览 6514

比亚迪固态电池要来!有望明年试生产

优视汽车 浏览 2025

日本新一代货运飞船 HTV-X 首飞,为国际空间站送“快递”

IT之家 浏览 3715

如果可以,希望鲁豫老师再工作30年!

时尚COSMO 浏览 2777

谭松韵,为什么百搭?

温柔娱公子 浏览 2875

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 8599

官宣!国足3月参加FIFA系列赛,过招两大世界杯劲旅+非洲杯5冠王

我爱英超 浏览 2562

小米集团宣布最高25亿港元的自动股份回购计划并将注销

网易财经 浏览 2559

舒淇现身亲揭《女孩》没报金马奖原因

ETtoday星光云 浏览 3556

浙江大学StaMo实现静态图像生成机器人动作

科技行者 浏览 3392

宗馥莉辞职内幕曝光,大女主的复仇之路,如何伤了娃哈哈?

北向财经 浏览 3640

澳网总监:女子赛事若采用五盘三胜,或将在2027年实施

懂球帝 浏览 2367

特朗普宣布停火之前 神秘资金精准做空原油、做多美股

每日经济新闻 浏览 56601

再次掀翻AI圈!Sora2面前,MiniMax的另类打法

南方都市报 浏览 3516
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1