关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3709人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蒋奇明挖到宝了,剧版《731》口碑井喷,抗战剧又有了新的标杆

娱乐圈笔娱君 浏览 3007

资产上亿女老板突然失联 知情人:疑似被骗去泰国

上观新闻 浏览 22812

霍家主母显气度:一代卖船供学二代稳大局三代全颜面,四代无人及

不八卦会死星人 浏览 2568

凯塞多:之前没意识到自己的进球能力,现在会尝试并靠近禁区

懂球帝 浏览 2440

更换平面化设计 马自达全新品牌LOGO发布

车质网 浏览 3457

妈妈辈如何穿出“贵气感”?4个打扮习惯,轻松提升优雅气质

静儿时尚达人 浏览 3710

关系藏不住了?小S二女儿被曝恋情

小梊搞笑解说 浏览 3781

装修“精神角落”,就是这么上瘾

时尚COSMO 浏览 739

湖人想要维金斯补充侧翼防守 八村垒+1个首轮签热火能同意吗?

仰卧撑FTUer 浏览 2893

或将命名为镁9 方程豹首款轿车谍照曝光

车质网 浏览 3055

枪手又被黑?塔帅称VAR的解释不对

体坛周报 浏览 2572

时尚守艺人 | 这不是幻觉,麒麟真的眨了眼

时尚COSMO 浏览 3672

64岁男演员春节在景区打工,暴瘦引担忧!

扬子晚报 浏览 2008

五粮液前董事长李曙光被“双开”!卖酒类经销权牟利数额巨大,更多细节公布……

国际金融报 浏览 3625

美伊本周有望在土耳其开谈 伊朗或在核问题上松口

上观新闻 浏览 5018

镜报:格拉利什对阵曼城需要回避,这让英超的公平性受到损害

懂球帝 浏览 3890

本-福斯特谈C罗:他的确是弗格森的宠儿,因为他实在太出色了

懂球帝 浏览 3757

52岁郭德纲也没想到 徒弟阎鹤祥给他争光了

乡野小珥 浏览 3190

奥巴马意外现身 庆祝胜利

参考消息网 浏览 8486

海盗船新键盘内嵌直播控制台,1月29日开卖!

IT之家 浏览 2755

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 2983
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1