关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1410人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 2667

切尔西本赛季英超已有10人取得进球,与阿森纳并列最多

懂球帝 浏览 2728

卖了3199万元 德信集团董事长杭州豪宅被拍卖抵债

红星新闻 浏览 11206

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 1467

特朗普发登岛图片 上面写着"格陵兰岛2026年成美领土"

鲁中晨报 浏览 11293

战斗感十足 雷克萨斯LFR内饰谍照曝光

车质网 浏览 2683

60分!森林狼7名主力缺阵仍134-74狂胜广州,陈国豪6分

懂球帝 浏览 2773

高德放“榜”30天:百度携程“硬杠”,抖音小红书“包抄”

伯虎财经 浏览 2871

两位省委常委跨省履新 其中一人曾长期在中纪委工作

极目新闻 浏览 8673

《逍遥》最大谜团:村民献祭妹妹给树妖,为何秉烛只恨妖不恨人?

肆季娱乐 浏览 1735

全新前脸/三种座椅布局可选 第三代豪越L内外饰曝光

网易汽车 浏览 2606

女子卷入前夫780余万巨债 诉讼9年均被判"夫妻共债"

红星新闻 浏览 30222

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 2831

秦雯回应太傲慢!绝症编剧维权艰难,网友痛批《繁花》剧组残忍

萌神木木 浏览 3399

剑南春|国米2-1客胜维罗纳,泽林斯基破门,皮奥造乌龙绝杀

懂球帝 浏览 2402

因家人病危,布里斯班狮吼主教练将缺席下轮联赛

懂球帝 浏览 1625

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 2822

餐馆称免费加面游客二次续面却被要求付3元 官方通报

封面新闻 浏览 21028

德转预热拉什福德新一期身价:最低可能跌至3000万欧

懂球帝 浏览 3396

2胜5平,输给曼城后利兹联已连续7轮英超保持不败

懂球帝 浏览 1781

特朗普威胁对欧洲8国加税:直到美"彻底购买格陵兰岛"

红星新闻 浏览 5771
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1