关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2416人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

又嫁错人?贾静雯老公过往争议被扒,催生四胎还和老婆闺蜜搞暧昧

萌神木木 浏览 3669

云拒科技推出Yunjue Agent:能够从零开始自我进化的助手系统

科技行者 浏览 2460

有些路,不必每一步都走得那么用力

她刊 浏览 199

美海军"林肯"号航母打击群抵达中东地区

环球网资讯 浏览 2459

机器人,又杀出了第一股

投资家 浏览 3105

最新!这家险资巨头,透露康养生态布局进展

券商中国 浏览 2910

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者 浏览 3439

上海交大吴家睿:复杂的科学时代需要复杂性思维|全国科普月

上观新闻 浏览 4506

万宁突然关闭内地线上线下全部门店,连锁巨头这是怎么了?

江瀚视野 浏览 2958

事关钓鱼岛、南海等问题 国防部最新回应

环球网资讯 浏览 2707

斯基拉:马竞计划买断冈萨雷斯,费用为3200万欧+100万欧奖金

懂球帝 浏览 3863

日产携左舵版N7亮相2025日本移动出行展

网易汽车 浏览 3487

马塞洛:当年觉得皮克是个自以为是的蠢货,太烦人了

懂球帝 浏览 3799

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 2939

百度的AI叙事,刚刚开始

锦缎研究院 浏览 4337

两女生称花90多元入住成都民宿 在空调管道发现摄像头

极目新闻 浏览 106113

三星最贵手机:Galaxy Z TriFold三折叠手机跑分首曝

IT之家 浏览 3125

短剧晚会这天,生图下短剧演员现原形,秒变普男普女,唯一人赢麻

一娱三分地 浏览 828

大疆汪滔十年后首次采访:世界蠢得不可思议,我也是

雷科技 浏览 1055

“WPS”上热搜!雷军为金山办公实控人,员工平均年薪约38万,金山此前发文:雷军任名誉董事长,不领薪酬

大象新闻 浏览 3782

全球首个太空AI诞生,H100在轨炼出!马斯克爆赞

新智元 浏览 3013
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1