nous sommes en 2026. tout le monde utilise le code claude et génère un trillion de tokens par jour. pendant ce temps, la majorité des fournisseurs de modèles ouverts ne transmettent toujours pas les hits de cache à leurs consommateurs, rendant chaque nouveau message une entreprise coûteuse.