Sei in un colloquio per ingegnere AI presso Google. L'intervistatore chiede: "I nostri dati sono distribuiti su diverse fonti (Salesforce, Gmail, Drive, ecc.) Come costruiresti un motore di query unificato su di essi?" Tu: "Incorporerò tutto in un database vettoriale e farò RAG." Colloquio finito! Molti sviluppatori pensano ancora che il recupero del contesto sia una pipeline lineare: Chunk → Embed → Retrieve → Generate Questo funziona bene per dimostrazioni semplici, ma i sistemi di produzione necessitano di qualcosa di fondamentalmente diverso. Per capire meglio, considera questa query: "Confronta le nostre performance di vendita del Q4 nella regione di Chicago rispetto alle proiezioni dell'anno scorso formulate in una riunione con gli stakeholder." Questa singola query richiede: - Dati di vendita dal tuo database SQL - Relazioni grafiche (gerarchia organizzativa) - Ricerca vettoriale su report di proiezione - Filtraggio basato sul tempo (Q4 di quest'anno rispetto all'anno scorso) - Controlli di autorizzazione (per l'autorizzazione dell'utente) ...