Más contexto no significa mejores agentes. El enfoque actual de la memoria del agente es la reproducción de transcripciones, donde añades cada interacción pasada al prompt. Más historia, más información, mejores decisiones. La alternativa es la memoria basada en recuperación, donde almacenas interacciones pasadas externamente y recuperas artefactos relevantes por turno. Aunque son efectivos hasta cierto punto, ambos enfoques fracasan a medida que las interacciones se extienden. La reproducción de transcripciones provoca un crecimiento de contexto ilimitado, reduce la selectividad de la atención y permite que los errores tempranos persistan mediante reexposiciones repetidas. La recuperación optimiza para la similitud semántica, no para la relevancia de la decisión, y los errores de selección se acumulan entre turnos. Este nuevo artículo presenta el Agent Cognitive Compressor (ACC), un controlador de memoria inspirado en la bio que reemplaza la repetición de transcripciones por un estado interno acotado actualizado en línea en cada momento. Lo que los agentes necesitan no es más contexto, sino un mejor control de la memoria. ACC mantiene un Estado Cognitivo Comprimido (CCS), una representación gobernada por el esquema que contiene únicamente variables críticas para la decisión: objetivos, restricciones, entidades, relaciones y señales de incertidumbre. En cada turno, el ACC retira artefactos candidatos, los filtra a través de una puerta de calificación y solo compromete lo que pasa al siguiente estado. De forma crucial, la ACC separa la recuperación de artefactos del compromiso estatal. El contenido recuperado solo puede influir en el siguiente estado mediante compresión restringida por el esquema. Esto evita que el contenido no verificado se convierta en memoria persistente. A lo largo de 600 evaluaciones en tiempo real (30.000 turnos) que abarcan operaciones de TI, respuesta de ciberseguridad y flujos de trabajo sanitarios, ACC mantuvo memoria limitada mientras la reproducción de transcripciones crecía de forma lineal. La ACC logró tasas de alucinación y deriva cercanas a cero en episodios de 50 turnos, mientras que los agentes basales y de recuperación mostraron fallos crecientes tras los turnos de estrés. El agente de recuperación requería restringir la recuperación a solo 3 artefactos por turno para limitar la escalada de la deriva. Aun así, los errores de selección causaban inestabilidad. Las fallas de agentes en múltiples vueltas se deben menos a la falta de conocimiento que a un control débil de la memoria. La compresión cognitiva proporciona una base práctica para agentes fiables a largo plazo. Papel: ...