Llevo más de un año desarrollando agentes de IA en producción. Aquí hay un problema común al que se enfrentan los desarrolladores cuando escalan agentes a producción: Normalmente alternan entre servicios separados para vectores, datos estructurados y sesiones. Tres grupos de conexiones diferentes. Tres estrategias de respaldo. Tres paneles de control. El bucle de agentes en sí es sencillo con razonamiento, herramientas y memoria, pero la infraestructura se convierte en el cuello de botella. Si quieres ver una forma más limpia de manejar esto, yo he creado un agente usando @MongoDB como único backend para todo. He trabajado con su equipo para compartir esto contigo. La introducción es sencilla: ↳ Empieza con un documento PDF. El agente responderá a las preguntas recordando conversaciones anteriores. ↳ Primero, divide el PDF en fragmentos e incrustarlo usando el modelo de Voyage AI. Esos embeddings van directamente a MongoDB con un índice vectorial. ↳ Entonces defines dos herramientas: una para búsqueda vectorial y otra para cálculos básicos si es necesario. El agente decide cuál usar en función de la consulta. ↳ La memoria se almacena en la misma base de datos bajo IDs de sesión. Cada interacción que tiene el agente se escribe de vuelta, para poder referenciar turnos anteriores. ↳ El planificador lo une. Mira el historial de conversaciones, decide si necesita una herramienta, ejecuta esa herramienta y genera la respuesta final. Aquí es donde importa el backend unificado: Cuando el agente busca contexto, está consultando la misma base de datos que almacena las sesiones de usuario y los datos estructurados. Cuando escribe en memoria, la misma instancia de MongoDB se encarga de las incrustaciones vectoriales. ...