关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者893人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

视频号到赚钱的时候了吗?有人月GMV3000万,有人看不懂要放弃

刺猬公社 浏览 16440

刘宇宁现身龙年春晚彩排,娱乐圈的人情世故,被体现得淋漓尽致

不八卦会死星人 浏览 13163

标普将全球最大稳定币运营商Tether资产评级下调至最低等,质疑挂钩美元能力

华尔街见闻官方 浏览 358

楼市半载江湖巨变:超300条调控政策,仍未扭转市场降温走向

第一财经资讯 浏览 15360

羊绒专场|| 如果秋冬只买一件针织衫,我一定毫不犹豫选它(已穿上)

黎贝卡的异想世界 浏览 1861

法医谈货拉拉女孩跳车事件,从窗户跳下的可能性不大

趣看热点 浏览 184432

不同身材如何挑选无袖衫?

LinkFashion 浏览 15807

五十多岁的女性秋季别瞎打扮,这3个技巧实用还时髦,快收藏

静儿时尚达人 浏览 688

15.69 万元起!全新深蓝 S07 上市交付

汽车商评 浏览 1704

记者:默郡警方安监控,严防利物浦vs曼城一战有人闹事

直播吧 浏览 11902

42岁郭晶晶奥运主题杂志大片曝光,穿大码西装,梳大背头又美又飒

娱絮 浏览 10910

整个A股,只有这15个股票有垄断特征,市盈率低至12倍!

资本百科 浏览 16948

克洛普:瓜帅是最好的教练,德布劳内会和杰拉德一样载入史册

直播吧 浏览 12192

布劳恩登全美热搜:创29年纪录被赞完美表演 NCAA+NBA冠军来了?

颜小白的篮球梦 浏览 16591

小型无人机已经在解放军中大量应用

环球网资讯 浏览 18567

不去掉这一点,贾国龙就赢不了罗永浩

振华观史 浏览 1579

售价47.8-66.8万元 2025款捷豹F-PACE正式上市

网易汽车 浏览 10616

张恒远被曝因黑色素瘤扩散为喉癌去世,灵堂照公开

好丹 浏览 16275

今年冬天一定要拥有这4件“大衣服”,松弛又好看!

LinkFashion 浏览 202

最真实又时髦的路人街拍!看完想照着copy一周

黎贝卡的异想世界 浏览 13631

台军退役扫雷车放公园 "26根大钢牙几乎被拔光"

环球网资讯 浏览 16788
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1