J'ai l'impression que l'algorithme de recherche sera à nouveau génial. À mesure que le contexte ou l'invite devient plus grand. Comment réduire correctement la consommation de jetons dépend vraiment de quelle invite avec quel contexte nous devrions soumettre. Je ne pense pas que la compression fonctionnera aussi bien lorsque vous avez une grande banque de mémoire. En effet, 90 % de l'invite peut encore ne pas être nécessaire. Plutôt que de soumettre tout le contexte/l'invite, nous recherchons et déduisons l'ensemble du contexte pour ne garder que les informations pertinentes.