Managementul autonom al memoriei în agenții LLM Agenții LLM se confruntă cu sarcini pe termen lung din cauza suprasolicitării contextului. Pe măsură ce istoricul interacțiunilor crește, costurile computaționale explodează, latența crește, iar raționamentul se degradează din cauza distragerii cauzate de erori trecute irelevante. Abordarea standard este doar de adăugare: fiecare gând, apel la unealtă și răspuns se acumulează permanent. Acest lucru funcționează pentru sarcini scurte, dar garantează eșecul pentru explorarea complexă. Această cercetare introduce Focus, o arhitectură centrată pe agent inspirată de mucegaiul mucus (Physarum polycephalum). Perspectiva biologică: organismele nu păstrează înregistrări perfecte ale fiecărei mișcări printr-un labirint. Ei păstrează harta învățată. Focus oferă agenților două primitive noi: start_focus și complete_focus. Agentul decide autonom când să consolideze învățăturile într-un bloc persistent de Cunoaștere și taie activ istoricul brut al interacțiunilor. Nu există temporizatoare externe sau euristici care să forțeze compresia. Declară ceea ce investighezi, explorează folosind instrumente standard și apoi consolidează rezumând ce s-a încercat, ce s-a învățat și rezultatul. Sistemul adaugă acest lucru unui bloc Knowledge persistent și șterge tot ce se află între punctul de control și pasul curent. Aceasta transformă contextul monoton în creștere într-un model în formă de dinți de ferăstrău: creștere în timpul explorării, prăbușire în timpul consolidării. Evaluarea pe SWE-bench Lite cu Claude Haiku 4.5 arată că Focus obține o reducere de 22,7% a tokenurilor (14,9M până la 11,5M tokens), menținând în același timp aceeași acuratețe (60% atât pentru baseline, cât și pentru Focus). Cazurile individuale au înregistrat economii de până la 57%. Impulsul agresiv contează. Stimularea pasivă a adus doar 6% economii. Instrucțiuni explicite de comprimare la fiecare 10-15 apeluri de uneltă, cu memento-uri de sistem, au crescut compresiile de la 2.0 la 6.0 pe sarcină. Modelele capabile își pot autoregla autonom contextul atunci când li se oferă instrumentele și indicațiile adecvate, deschizând căi pentru sisteme agentice conștiente de costuri fără a sacrifica performanța sarcinii. Hârtie: Învață să construiești agenți AI eficienți în academia noastră: