Voimmeko ymmärtää piilevien päättelyjen (CoT) ajatusketjun (CoT) nykyisillä mecha-interp-tekniikoilla? Käy ilmi, että voimme löytää tulkittavaa rakennetta, ainakin yksinkertaisissa matemaattisissa tehtävissä! Lyhyessä tutkimuksessa osoitamme, että latentit vektorit edustavat esimerkiksi Välilaskelmat