Mais contexto não significa melhores agentes. A abordagem atual para a memória dos agentes é a reprodução de transcrições, onde você anexa cada interação passada ao prompt. Mais história, mais informação, melhores decisões. A alternativa é a memória baseada em recuperação, onde você armazena interações passadas externamente e recupera artefatos relevantes a cada turno. Embora eficaz até certo ponto, ambas as abordagens falham à medida que as interações se estendem. A reprodução de transcrições causa um crescimento de contexto sem limites, reduz a seletividade da atenção e permite que erros iniciais persistam através da reexposição repetida. A recuperação otimiza para similaridade semântica, não para relevância de decisão, e os erros de seleção se acumulam ao longo dos turnos. Este novo artigo introduz o Compressor Cognitivo de Agentes (ACC), um controlador de memória inspirado na biologia que substitui a reprodução de transcrições por um estado interno limitado atualizado online a cada turno. O que os agentes precisam não é de mais contexto, mas de um melhor controle da memória. O ACC mantém um Estado Cognitivo Comprimido (CCS), uma representação governada por esquemas que contém apenas variáveis críticas para a decisão: objetivos, restrições, entidades, relações e sinais de incerteza. A cada turno, o ACC recorda artefatos candidatos, filtra-os através de um portão de qualificação e compromete apenas o que passa para o próximo estado. Crucialmente, o ACC separa a recuperação de artefatos do compromisso de estado. O conteúdo recuperado só pode influenciar o próximo estado através de compressão restrita por esquemas. Isso impede que conteúdos não verificados se tornem memória persistente. Em 600 avaliações ao vivo (30.000 turnos) abrangendo operações de TI, resposta a cibersegurança e fluxos de trabalho de saúde, o ACC manteve uma memória limitada enquanto a reprodução de transcrições cresceu linearmente. O ACC alcançou taxas de alucinação e desvio quase zero em episódios de 50 turnos, enquanto agentes de baseline e recuperação mostraram falhas crescentes após turnos de estresse. O agente de recuperação exigiu restringir a recuperação a apenas 3 artefatos por turno para limitar a escalada do desvio. Mesmo assim, erros de seleção causaram instabilidade. As falhas de agentes em múltiplos turnos são impulsionadas menos pela falta de conhecimento do que pelo fraco controle da memória. A compressão cognitiva fornece uma base prática para agentes confiáveis de longo prazo. Artigo: ...