1/ Wir wissen, dass Transformer bei der Längenerweiterung versagen. Aber neue Forschungen zeigen einen tieferliegenden Fehler: Sie versagen beim IN-DISTRIBUTION-Zustands-Tracking. Sie lernen keine algorithmischen Regeln, sie merken sich nur isolierte Schaltungen pro Länge. 🧵