Autonominen muistinhallinta LLM-agenteissa LLM-agentit kamppailevat pitkän aikavälin tehtävien kanssa kontekstin paisumisen vuoksi. Kun vuorovaikutushistoria kasvaa, laskennalliset kustannukset räjähtivät räjähdysmäisesti, viive kasvaa ja päättely heikkenee merkityksettömien menneiden virheiden aiheuttaman häiriön vuoksi. Tavanomainen lähestymistapa on vain liitännäinen: jokainen ajatus, työkalukutsu ja vastaus kertyy pysyvästi. Tämä toimii lyhyissä tehtävissä, mutta takaa epäonnistumisen monimutkaisessa tutkimuksessa. Tämä tutkimus esittelee Focusin, agenttikeskeisen arkkitehtuurin, joka on saanut inspiraationsa limahomeesta (Physarum polycephalum). Biologinen oivallus: eliöt eivät säilytä täydellisiä tietoja jokaisesta liikkeestä labyrintissa. He säilyttävät opitun kartan. Focus antaa agenteille kaksi uutta primitiiviä: start_focus ja complete_focus. Agentti päättää itsenäisesti, milloin opitut yhdistetään pysyvään tietolohkoon ja karsia aktiivisesti raakaa vuorovaikutushistoriaa. Ei ulkoisia ajastimia tai heuristiikkoja, jotka pakottaisivat pakkauksen. Se ilmoittaa, mitä tutkit, tutkii tavanomaisilla työkaluilla ja tiivistää yhteen, mitä yritettiin, mitä opittiin ja mikä lopputulos on. Järjestelmä lisää tämän pysyvään tietolohkoon ja poistaa kaiken tarkistuspisteen ja nykyisen vaiheen välillä. Tämä muuttaa monotonisesti kasvavan kontekstin sahahampaaksi: kasvu tutkimusmatkan aikana, romahdus konsolidoinnin aikana. SWE-bench Lite -analyysi Claude Haiku 4.5:n kanssa osoittaa, että Focus saavuttaa 22,7 % tokenien vähennyksen (14,9 miljoonasta 11,5 miljoonaan tokenista) säilyttäen samalla identtisen tarkkuuden (60 % sekä perus- että Focus-mallissa). Yksittäiset tapaukset osoittivat säästöjä jopa 57 %. Aggressiivinen kehotus on tärkeää. Passiivinen ohjaus toi vain 6 % säästöjä. Eksplisiittiset ohjeet pakata joka 10–15 työkalukutsun välein, järjestelmämuistutuksilla, lisäsivät pakkausarvoa 2.0:sta 6.0:aan per tehtävä. Kykenevät mallit voivat itseohjata kontekstiaan itsenäisesti, kun niille annetaan sopivat työkalut ja kehotukset, avaten polkuja kustannustietoisille agenttijärjestelmille tinkimättä tehtävien suorituskyvystä. Artikkeli: Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme: