Le plus grand rapport sur l'utilisation de l'IA de 2025 vient de sortir (100 trillions de tokens d'utilisation réelle sur OpenRouter) 8 conclusions qui m'ont le plus surpris : 1. Le jeu de rôle et la fiction créative sont la 2ème plus grande catégorie et >50% de toute l'utilisation open-source. Les modèles non censurés absorbent la demande pour le "fan-fic" et le contenu NSFW. 2. La programmation représente désormais >50% de tous les tokens LLM. C'était 11% il y a douze mois. Le codage est littéralement devenu le système d'exploitation de l'IA. 3. Claude d'Anthropic est utilisé pour >80% de la programmation et presque zéro pour le jeu de rôle. C'est le modèle de "travail sérieux" tandis que DeepSeek est le roi du divertissement (avec 2/3 du trafic de jeu de rôle) 4. Un modèle qui est le premier à maîtriser une charge de travail douloureuse crée un verrouillage presque permanent. Les cohortes de début 2025 de Claude 4 Sonnet et Gemini 2.5 Pro conservent encore 40–50% des utilisateurs six mois plus tard, tandis que chaque cohorte ultérieure se désengage. Ils appellent cela l'effet de la Pantoufle de Verre : être le premier à s'adapter à une nouvelle charge de travail, et la princesse ne part jamais. 5. La demande est follement inélastique au prix. Les utilisateurs paient volontiers 10–50× plus par token pour Claude ou GPT-5 s'ils économisent dix minutes de débogage. Être bon marché n'est pas du tout suffisant. 6. La nouvelle taille de modèle idéale est de 20–70B paramètres. Les petits modèles ont une faible utilisation, les modèles géants se fragmentent, et le niveau moyen absorbe les deux. 7. Les modèles open-source sont passés de <5% à ~33% de l'utilisation totale en un an, presque entièrement propulsés par des laboratoires chinois (DeepSeek, Qwen, Moonshot, MiniMax). Il n'y a plus de modèle unique le meilleur. Les dix meilleurs modèles par volume proviennent de huit laboratoires différents. 8. L'Asie représente désormais 31% des dépenses mondiales (était de 13% il y a un an). Singapour + Chine + Corée à eux seuls représentent presque 20% de tous les tokens. L'ère d'un modèle fondamental pour les gouverner tous est révolue. Nous vivons désormais dans un monde définitivement fragmenté où le modèle que vous utilisez dépend entièrement de ce que vous en faites - écrire du code ? écrire des fanfics ? Quoi qu'il en soit, il est clair qu'il n'y a qu'une seule direction pour les dépenses en tokens : vers le haut et vers la droite. Rapport complet de @a16z + @OpenRouterAI (lien dans les commentaires).