8 RAG-arkitekturer for AI-ingeniører: (forklart med bruk) 1) Naiv RAG ↳ Henter dokumenter utelukkende basert på vektorlikhet mellom spørringsembeddingen og lagrede embeddinger. ↳ Fungerer best for enkle, faktabaserte spørringer der direkte semantisk matching er tilstrekkelig. 2) Multimodal RAG ↳ Håndterer flere datatyper (tekst, bilder, lyd osv.) ved å legge inn og hente på tvers av modaliteter. ↳ Ideell for tverrmodale hentingsoppgaver som å svare på en tekstforespørsel med både tekst- og bildekontekst. 3) HyDE (hypotetiske dokumentinnlegginger) ↳ Forespørsler er ikke semantisk like dokumenter. ↳ Denne teknikken genererer et hypotetisk svardokument fra forespørselen før henting. ↳ Bruker denne genererte dokumentets embedding for å finne mer relevante ekte dokumenter. 4) Korrigerende RAG ↳ Validerer hentede resultater ved å sammenligne dem med pålitelige kilder (f.eks. nettsøk). ↳ Sikrer oppdatert og nøyaktig informasjon, filtrering eller korrigering av hentet innhold før det sendes til LLM-en. 5) Graf RAG ↳ Konverterer hentet innhold til en kunnskapsgraf for å fange relasjoner og enheter. ↳ Forbedrer resonnement ved å gi strukturert kontekst sammen med råtekst til LLM-en. 6) Hybrid RAG ↳ Kombinerer tett vektorgjenfinning med grafbasert henting i en enkelt pipeline. ↳ Nyttig når oppgaven krever både ustrukturert tekst og strukturerte relasjonsdata for rikere svar. 7) Adaptiv RAG...