Estás en una entrevista para ingeniero de IA en Google. El entrevistador pregunta: "Nuestros datos están repartidos en varias fuentes (Salesforce, Gmail, Drive, etc.) ¿Cómo construirías un motor de consulta unificado sobre ellos?" Tú: "Incorporaré todo en una base de datos vectorial y haré RAG." ¡Entrevista terminada! Muchos desarrolladores todavía piensan que la recuperación de contexto es una tubería lineal: Chunk → Embed → Retrieve → Generate Esto funciona muy bien para demostraciones simples, pero los sistemas de producción necesitan algo fundamentalmente diferente. Para entender mejor, considera esta consulta: "Compara nuestro rendimiento de ventas del Q4 en la región de Chicago con las proyecciones del año pasado formuladas en una reunión con las partes interesadas." Esta única consulta requiere: - Datos de ventas de tu base de datos SQL - Relaciones gráficas (jerarquía organizacional) - Búsqueda vectorial sobre informes de proyección - Filtrado basado en el tiempo (Q4 de este año vs el año pasado) - Comprobaciones de permisos (para autorización de usuario) ...