Maggiore contesto non significa agenti migliori. L'approccio attuale alla memoria degli agenti è il replay delle trascrizioni, dove si aggiungono tutte le interazioni passate al prompt. Maggiore storia, più informazioni, decisioni migliori. L'alternativa è la memoria basata sul recupero, dove si memorizzano le interazioni passate esternamente e si recuperano artefatti rilevanti per turno. Sebbene efficace fino a un certo punto, entrambi gli approcci falliscono man mano che le interazioni si estendono. Il replay delle trascrizioni causa una crescita del contesto illimitata, riduce la selettività dell'attenzione e consente che gli errori iniziali persistano attraverso la ripetuta riesposizione. Il recupero ottimizza per la somiglianza semantica, non per la rilevanza decisionale, e gli errori di selezione si accumulano nei turni. Questo nuovo documento introduce l'Agent Cognitive Compressor (ACC), un controllore di memoria ispirato alla biologia che sostituisce il replay delle trascrizioni con uno stato interno limitato aggiornato online a ogni turno. Ciò di cui gli agenti hanno bisogno non è più contesto, ma un migliore controllo della memoria. L'ACC mantiene uno Stato Cognitivo Compresso (CCS), una rappresentazione governata da schemi contenente solo variabili critiche per la decisione: obiettivi, vincoli, entità, relazioni e segnali di incertezza. Ad ogni turno, l'ACC richiama artefatti candidati, li filtra attraverso un gate di qualificazione e si impegna solo con ciò che passa allo stato successivo. Fondamentalmente, l'ACC separa il richiamo degli artefatti dall'impegno allo stato. I contenuti recuperati possono influenzare il prossimo stato solo attraverso una compressione vincolata dallo schema. Questo impedisce che contenuti non verificati diventino memoria persistente. In 600 valutazioni dal vivo (30.000 turni) che spaziano tra operazioni IT, risposta alla cybersecurity e flussi di lavoro sanitari, l'ACC ha mantenuto una memoria limitata mentre il replay delle trascrizioni cresceva linearmente. L'ACC ha raggiunto tassi di allucinazione e deriva quasi zero in episodi di 50 turni, mentre gli agenti di base e di recupero mostrano un aumento dei fallimenti dopo turni di stress. L'agente di recupero ha richiesto di limitare il richiamo a soli 3 artefatti per turno per limitare l'escalation della deriva. Anche in quel caso, gli errori di selezione hanno causato instabilità. I fallimenti degli agenti multi-turno sono guidati meno dalla mancanza di conoscenza che da un debole controllo della memoria. La compressione cognitiva fornisce una base pratica per agenti affidabili a lungo termine. Documento: ...