Det är 2026. Alla använder Claude Code och genererar en biljon tokens om dagen. Samtidigt skickar majoriteten av öppna modellleverantörer fortfarande inte cache-träffar till sina konsumenter, vilket gör varje nytt meddelande till en kostsam verksamhet.