Ótimo artigo sobre Memória Agente. Os agentes LLM precisam tanto de memória de longo prazo quanto de memória de curto prazo para lidar com tarefas complexas. No entanto, a abordagem padrão hoje trata esses como componentes separados, cada um com suas próprias heurísticas, controladores e estratégias de otimização. Mas a memória não é dois sistemas independentes. É um único processo cognitivo que decide o que armazenar, recuperar, resumir e esquecer. Esta nova pesquisa introduz o AgeMem, uma estrutura unificada que integra a gestão de memória de longo e curto prazo diretamente na política do agente através de ações baseadas em ferramentas. Em vez de depender de regras baseadas em gatilhos ou gerenciadores de memória auxiliares, o agente aprende quando e como invocar operações de memória: ADD, UPDATE, DELETE para armazenamento de longo prazo, e RETRIEVE, SUMMARY, FILTER para gestão de contexto. Utiliza uma estratégia de RL progressiva em três etapas. Primeiro, o modelo aprende o armazenamento de memória de longo prazo. Depois, domina a gestão de contexto de curto prazo. Finalmente, coordena ambos sob configurações de tarefa completas. Para lidar com as experiências fragmentadas das operações de memória, eles projetam um GRPO (Otimização de Política Relativa em Grupo) passo a passo que transforma dependências entre estágios em sinais aprendíveis. Os resultados em cinco benchmarks de longo prazo: > No Qwen2.5-7B, o AgeMem alcança uma pontuação média de 41.96 em comparação com 37.14 para o Mem0, uma melhoria de 13%. > No Qwen3-4B, a diferença aumenta: 54.31 vs 44.70. Adicionar memória de longo prazo sozinha proporciona ganhos de +10-14%. > Adicionar treinamento de RL acrescenta mais +6%. > O sistema unificado completo com ambos os tipos de memória alcança até +21.7% de melhoria em relação às linhas de base sem memória. A gestão unificada da memória através de ações baseadas em ferramentas aprendíveis supera pipelines heurísticos fragmentados, permitindo que os agentes decidam adaptativamente o que lembrar e esquecer com base nas demandas da tarefa. Artigo: ...