Känner att sökalgoritmen kommer bli bra igen. När kontexten eller prompten blir större. Hur man korrekt minskar tokenkonsumtionen faller egentligen under vilken prompt med vilket sammanhang vi ska skicka in. Jag tror inte att kompression fungerar så bra när du har en stor minnesbank. Eftersom 90 % av prompten kanske fortfarande inte behövs. Istället för att skicka in all kontext/prompt söker vi och härleder hela kontexten endast för relevant information.