1/ Transformers'ın uzun bir ekstrapolasyonda başarısız olduğunu biliyoruz. Ancak yeni araştırmalar daha derin bir kusur gösteriyor: DÖLÜSÜMLİ durum takibinde başarısız oluyorlar. Algoritmik kuralları öğrenmezler, sadece uzunluk başına izole devreleri ezberlerler. 🧵