Du bist in einem Interview für einen KI-Ingenieur bei Google. Der Interviewer fragt: "Unsere Daten sind über mehrere Quellen verteilt (Salesforce, Gmail, Drive usw.) Wie würdest du eine einheitliche Abfrage-Engine dafür aufbauen?" Du: "Ich werde alles in einer Vektordatenbank einbetten und RAG durchführen." Interview beendet! Viele Entwickler denken immer noch, dass die Kontextabfrage eine lineare Pipeline ist: Chunk → Einbetten → Abrufen → Generieren Das funktioniert großartig für einfache Demos, aber Produktionssysteme benötigen etwas grundlegend anderes. Um es besser zu verstehen, betrachte diese Abfrage: "Vergleiche unsere Verkaufsleistung im vierten Quartal in der Region Chicago mit den Prognosen des letzten Jahres, die in einem Meeting mit den Stakeholdern formuliert wurden." Diese einzelne Abfrage erfordert: - Verkaufsdaten aus deiner SQL-Datenbank - Graphbeziehungen (organisatorische Hierarchie) - Vektorsuche über Projektberichte - Zeitbasierte Filterung (Q4 dieses Jahr vs. letztes Jahr) - Berechtigungsprüfungen (für die Benutzerautorisierung) ...