Bạn đang tham gia phỏng vấn kỹ sư AI tại Google. Người phỏng vấn hỏi: "Dữ liệu của chúng tôi được phân bổ trên nhiều nguồn (Salesforce, Gmail, Drive, v.v.) Bạn sẽ xây dựng một công cụ truy vấn thống nhất trên đó như thế nào?" Bạn: "Tôi sẽ nhúng mọi thứ vào một cơ sở dữ liệu vector và thực hiện RAG." Phỏng vấn kết thúc! Nhiều lập trình viên vẫn nghĩ rằng việc truy xuất ngữ cảnh là một quy trình tuyến tính: Phân đoạn → Nhúng → Truy xuất → Tạo ra Điều này hoạt động rất tốt cho các bản demo đơn giản, nhưng các hệ thống sản xuất cần một cái gì đó hoàn toàn khác. Để hiểu rõ hơn, hãy xem xét truy vấn này: "So sánh hiệu suất bán hàng Q4 của chúng tôi ở khu vực Chicago với các dự đoán của năm ngoái được hình thành trong một cuộc họp với các bên liên quan." Truy vấn đơn này yêu cầu: - Dữ liệu bán hàng từ cơ sở dữ liệu SQL của bạn - Mối quan hệ đồ thị (cấu trúc tổ chức) - Tìm kiếm vector trên các báo cáo dự đoán - Lọc theo thời gian (Q4 năm nay so với năm ngoái) - Kiểm tra quyền truy cập (cho quyền người dùng) ...