关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2414人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥迪A8L和雷克萨斯LS或无后续全尺寸轿车接班!

凡兮说 浏览 3490

理想「断腕」:关店100家,李想手里还剩什么牌?

电车通 浏览 2458

陈匡怡怒斥台媒毁人名节,自曝写了遗书

萌神木木 浏览 2355

王传君影帝封号引发争议,24小时后遭遇令人不适事件

80后房车生活 浏览 3377

花江峡谷大桥推"无绳蹦极":提供高度选择 价格1600元

极目新闻 浏览 8410

《惊蛰无声》预告质感太差!杨幂没精神刘诗诗像盲人,被嘲像网大

萌神木木 浏览 2614

用了8年还心动,这笔钱是花得真值啊

黎贝卡的异想世界 浏览 766

歼-20战机首次进行静态展示

新京报 浏览 3690

全尺寸SUV定位 奕境首台工程样车下线/量产版4月发布

网易汽车 浏览 2928

升级800V高压架构 新款奔驰EQS谍照曝光

车质网 浏览 2612

梓渝施洛华官宣预热!5天连更藏着什么破局密码

让生活充满温暖 浏览 2622

近期石柯社媒频繁更新?他已签约成为杭州致禾文化旗下艺人

懂球帝 浏览 3984

今年冬天流行的“露袜”穿法,时髦又减龄!

LinkFashion 浏览 2935

《阿凡达3》第一波真实口碑,国内票价令人咋舌

娱乐圈笔娱君 浏览 2914

一小米SU7在行驶中突然失控:前轮车轴完全断裂

PChome电脑之家 浏览 3714

今年流行的这件“短外套”美爆了,怎么搭都优雅贵气!

LinkFashion 浏览 2980

何超莲豪宅度中秋,阖家团圆唯独不见窦骁?

不八卦会死星人 浏览 3359

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

韩小娱 浏览 2406

郑丽文就职演说让马英九流泪 台媒:他看见蓝营的希望

海峡导报社 浏览 9430

北约或取消峰会 避免与特朗普冲突出现"戏剧性场面"

环球网资讯 浏览 33636

竞逐AI内容,爱奇艺先出手了

连线Insight 浏览 3641
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1