Cảm giác như thuật toán tìm kiếm sẽ lại tuyệt vời. Khi ngữ cảnh hoặc lời nhắc ngày càng lớn hơn. Cách giảm thiểu đúng mức tiêu thụ token thực sự phụ thuộc vào lời nhắc nào với ngữ cảnh nào mà chúng ta nên gửi. Tôi không nghĩ rằng nén sẽ hoạt động tốt khi bạn có một ngân hàng bộ nhớ lớn. Bởi vì 90% của lời nhắc có thể vẫn không cần thiết. Thay vì gửi toàn bộ ngữ cảnh/lời nhắc, chúng ta tìm kiếm và suy luận toàn bộ ngữ cảnh chỉ để lấy thông tin liên quan.