8 arsitektur RAG untuk Insinyur AI: (dijelaskan dengan penggunaan) 1) RAG Naif ↳ Mengambil dokumen murni berdasarkan kesamaan vektor antara penyematan kueri dan penyematan yang disimpan. ↳ Bekerja paling baik untuk kueri berbasis fakta sederhana di mana pencocokan semantik langsung sudah cukup. 2) RAG Multimoda ↳ Menangani beberapa jenis data (teks, gambar, audio, dll.) dengan menyematkan dan mengambil di seluruh modalitas. ↳ Ideal untuk tugas pengambilan lintas modal seperti menjawab kueri teks dengan konteks teks dan gambar. 3) HyDE (Penyematan Dokumen Hipotesis) ↳ Kueri tidak secara semantik mirip dengan dokumen. ↳ Teknik ini menghasilkan dokumen jawaban hipotetis dari kueri sebelum pengambilan. ↳ Menggunakan penyematan dokumen yang dihasilkan ini untuk menemukan dokumen nyata yang lebih relevan. 4) RAG korektif ↳ Memvalidasi hasil yang diambil dengan membandingkannya dengan sumber tepercaya (misalnya, pencarian web). ↳ Memastikan informasi terkini dan akurat, memfilter atau mengoreksi konten yang diambil sebelum diteruskan ke LLM. 5) Grafik RAG ↳ Mengonversi konten yang diambil menjadi grafik pengetahuan untuk menangkap hubungan dan entitas. ↳ Meningkatkan penalaran dengan menyediakan konteks terstruktur di samping teks mentah ke LLM. 6) RAG Hibrida ↳ Menggabungkan pengambilan vektor padat dengan pengambilan berbasis grafik dalam satu pipa. ↳ Berguna ketika tugas memerlukan teks tidak terstruktur dan data relasional terstruktur untuk jawaban yang lebih kaya. 7) RAG Adaptif...