Estive a construir Agentes de IA em produção durante mais de um ano. Aqui está um problema comum que os desenvolvedores enfrentam quando escalam agentes para produção: Eles normalmente equilibram entre serviços separados para vetores, dados estruturados e sessões. Três pools de conexão diferentes. Três estratégias de backup. Três painéis de monitorização. O ciclo do agente em si é simples, com raciocínio, ferramentas e memória, mas a infraestrutura torna-se o gargalo. Se você quiser ver uma maneira mais limpa de lidar com isso, construí um agente usando @MongoDB como o único backend para tudo. Trabalhei com a equipe deles para compartilhar isso com você. A configuração é simples: ↳ Comece com um documento PDF. O agente responderá a perguntas sobre ele enquanto se lembra de conversas passadas. ↳ Primeiro, divida o PDF e incorpore-o usando o modelo da Voyage AI. Essas incorporações vão diretamente para o MongoDB com um índice de vetor. ↳ Em seguida, você define duas ferramentas: uma para busca de vetores, outra para cálculos básicos, se necessário. O agente decide qual usar com base na consulta. ↳ A memória é armazenada no mesmo banco de dados sob IDs de sessão. Cada interação que o agente tem é registrada, para que ele possa referenciar turnos anteriores. ↳ O planejador junta tudo. Ele analisa o histórico de conversas, decide se precisa de uma ferramenta, executa essa ferramenta e gera a resposta final. Aqui está onde o backend unificado importa: Quando o agente busca contexto, ele está consultando o mesmo banco de dados que armazena sessões de usuários e dados estruturados. Quando escreve na memória, a mesma instância do MongoDB está lidando com as incorporações vetoriais. ...