介绍 𝘁𝗵𝗼𝘂𝗴𝗵𝘁𝗯𝘂𝗯𝗯𝗹𝗲𝘀:一个 *完全无监督* 的 LM,用于输入自适应的并行潜在推理 ✅ 自学一个具有正常预训练的推理模型 ✅ 与固定思维令牌相比,困惑度更低 没有花哨的损失,没有思维链标签 🚀