SSM:t lupasivat tehokasta kielimallintamista pitkiin konteksteihin, mutta toistaiseksi ne näyttävät toimivan huonommin kuin Transformers monissa ympäristöissä. Uusi tutkimuksemme viittaa siihen, että tämä ei ole ongelma yhteisissä valvontajärjestelmissä vaan siinä, miten käytämme niitä tällä hetkellä. Arxiv: 🧵