关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者874人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

长相普通的男人,是怎么靠穿搭翻盘的?

男士穿衣搭配杂志 浏览 14966

老而弥坚,追梦:我还能再打4-5年,新赛季我仍充满动力

懂球帝 浏览 891

2024中国车市:价格战将延续,淘汰赛将加速!

百姓评车 浏览 12922

现在呢?范迪克去年12月采访:曼联和皇马同一水平?无意冒犯

直播吧 浏览 19241

外媒:伊拉克阿萨德空军基地遭袭,10枚火箭弹飞来

环球网 浏览 25708

总投资约 2 亿元,长江首艘光伏发电豪华游轮“美维凯璇”首航

IT之家 浏览 1533

格列兹曼:媒体曾报道梅西对我不满,但比赛中他主动让点给我

懂球帝 浏览 1038

荷兰限制与美国情报共享:我们的情报被政治化了

澎湃新闻 浏览 6332

向佐郭碧婷女儿正脸照首曝光向太抱着孙女几乎不离手

趣看热点 浏览 26710

近5米车长+双电机四驱!深蓝硬派越野SUV入局还有机会吗?

CAR路里 浏览 12286

下周关注|进博会等多个重要活动将举办, 这些投资机会最靠谱

第一财经资讯 浏览 724

适合女生长期不换的微信头像!

Yuki女人故事 浏览 12662

《余生有涯》:就算原生家庭烂,也别劝我投降

澎湃新闻 浏览 984

追觅进军衣物护理市场,推出首款产品 P7 蒸汽挂烫机

IT之家 浏览 809

萧美琴在欧洲议会大楼参加会议并讲话 外交部回应

澎湃新闻 浏览 5929

曝曼联仍想出售马奎尔,欲签拜仁铁卫接班!滕哈格希望后防年轻化

罗米的曼联博客 浏览 12829

延续家族设计 纯电轿车智己L6申报图曝光

网易汽车 浏览 12582

枭龙突防S-400:中械武器如何改写印巴冲突

浏览 4830

春天还是衬衫叠穿最好看 时髦又高级

小陈聊搭配 浏览 20208

台媒:台空军IDF战机疑因发动机漏油空中起火

环球网资讯 浏览 14383

老人疑因吸氢气死亡:养生馆吸氢机卖4万 宣称可抗癌

潇湘晨报 浏览 84864
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1