我们能否利用当前的机制解释技术理解潜在推理 LLM 的思维链(CoT)? 事实证明,我们可以揭示可解释的结构,至少在简单的数学问题上! 在一项简短的研究中,我们展示了潜在向量代表例如中间计算。