Jesteś na rozmowie kwalifikacyjnej na inżyniera AI w Google. Rekruter pyta: "Nasze dane są rozproszone w kilku źródłach (Salesforce, Gmail, Drive itd.) Jak zbudowałbyś zjednoczony silnik zapytań nad nimi?" Ty: "Wszystko umieszczę w bazie danych wektorowych i zastosuję RAG." Rozmowa zakończona! Wielu programistów wciąż myśli, że pozyskiwanie kontekstu to liniowy proces: Chunk → Embed → Retrieve → Generate To działa świetnie w prostych demonstracjach, ale systemy produkcyjne potrzebują czegoś fundamentalnie innego. Aby lepiej to zrozumieć, rozważ to zapytanie: "Porównaj naszą wydajność sprzedaży w Q4 w regionie Chicago z prognozami z zeszłego roku, które zostały sformułowane na spotkaniu z interesariuszami." To pojedyncze zapytanie wymaga: - Danych sprzedażowych z twojej bazy danych SQL - Relacji graficznych (hierarchia organizacyjna) - Wyszukiwania wektorowego w raportach prognoz - Filtrowania czasowego (Q4 tego roku w porównaniu do zeszłego roku) - Sprawdzania uprawnień (w celu autoryzacji użytkownika) ...