8 種 AI 工程師的 RAG 架構: (附用法解釋) 1) 天真 RAG ↳ 僅根據查詢嵌入與存儲嵌入之間的向量相似性檢索文檔。 ↳ 最適合簡單的基於事實的查詢,當直接的語義匹配足夠時。 2) 多模態 RAG ↳ 通過跨模態嵌入和檢索來處理多種數據類型(文本、圖像、音頻等)。 ↳ 理想用於跨模態檢索任務,例如用文本和圖像上下文回答文本查詢。 3) HyDE(假設文檔嵌入) ↳ 查詢與文檔在語義上不相似。 ↳ 此技術在檢索之前從查詢生成一個假設的答案文檔。 ↳ 使用這個生成的文檔的嵌入來找到更相關的真實文檔。 4) 修正 RAG ↳ 通過將檢索結果與可信來源(例如,網絡搜索)進行比較來驗證檢索結果。 ↳ 確保信息的最新性和準確性,在傳遞給 LLM 之前過濾或修正檢索內容。 5) 圖形 RAG ↳ 將檢索的內容轉換為知識圖,以捕捉關係和實體。 ↳ 通過為 LLM 提供結構化上下文來增強推理,與原始文本一起使用。 6) 混合 RAG ↳ 在單一管道中結合密集向量檢索和基於圖的檢索。 ↳ 當任務需要非結構化文本和結構化關係數據以獲得更豐富的答案時非常有用。 7) 自適應 RAG...