Você está em uma entrevista para engenheiro de IA no Google. O entrevistador pergunta: "Nossos dados estão espalhados por várias fontes (Salesforce, Gmail, Drive, etc.) Como você construiria um mecanismo de consulta unificado sobre isso?" Você: "Vou embutir tudo em um banco de dados vetorial e fazer RAG." Entrevista encerrada! Muitos desenvolvedores ainda pensam que a recuperação de contexto é um pipeline linear: Chunk → Embed → Retrieve → Generate Isso funciona muito bem para demonstrações simples, mas sistemas de produção precisam de algo fundamentalmente diferente. Para entender melhor, considere esta consulta: "Compare nosso desempenho de vendas do Q4 na região de Chicago com as projeções do ano passado formuladas em uma reunião com as partes interessadas." Essa única consulta requer: - Dados de vendas do seu banco de dados SQL - Relações gráficas (hierarquia organizacional) - Busca vetorial sobre relatórios de projeção - Filtragem baseada em tempo (Q4 deste ano vs ano passado) - Verificações de permissão (para autorização do usuário) ...