1/ Sabemos que os Transformers falham na extrapolação de comprimento. Mas novas pesquisas mostram uma falha mais profunda: eles falham no rastreamento de estados em DISTRIBUIÇÃO. Eles não aprendem regras algorítmicas, apenas memorizam circuitos isolados por comprimento. 🧵