8 RAG-architecturen voor AI-engineers: (uitleg met gebruik) 1) Naive RAG ↳ Haalt documenten op puur op basis van vectorovereenstemming tussen de query-embedding en opgeslagen embeddings. ↳ Werkt het beste voor eenvoudige, feitelijke vragen waarbij directe semantische overeenstemming voldoende is. 2) Multimodale RAG ↳ Behandelt meerdere datatypes (tekst, afbeeldingen, audio, enz.) door te embedden en op te halen over modaliteiten heen. ↳ Ideaal voor cross-modale retrievaltaken zoals het beantwoorden van een tekstquery met zowel tekst- als afbeeldingscontext. 3) HyDE (Hypothetische Documentembeddings) ↳ Vragen zijn niet semantisch vergelijkbaar met documenten. ↳ Deze techniek genereert een hypothetisch antwoorddocument vanuit de query voordat het ophalen plaatsvindt. ↳ Gebruikt de embedding van dit gegenereerde document om relevantere echte documenten te vinden. 4) Correctieve RAG ↳ Valideert opgehaalde resultaten door ze te vergelijken met vertrouwde bronnen (bijv. webzoekopdrachten). ↳ Zorgt voor actuele en nauwkeurige informatie, filtert of corrigeert opgehaalde inhoud voordat deze naar de LLM wordt doorgestuurd. 5) Graf RAG ↳ Zet opgehaalde inhoud om in een kennisgrafiek om relaties en entiteiten vast te leggen. ↳ Verbetert redenering door gestructureerde context naast ruwe tekst aan de LLM te bieden. 6) Hybride RAG ↳ Combineert dichte vectorretrieval met graf-gebaseerde retrieval in een enkele pijplijn. ↳ Nuttig wanneer de taak zowel ongestructureerde tekst als gestructureerde relationele gegevens vereist voor rijkere antwoorden. 7) Adaptieve RAG...