Il più grande rapporto sull'uso dell'AI del 2025 è appena uscito (100 trilioni di token di utilizzo reale su OpenRouter) 8 scoperte che mi hanno sorpreso di più: 1. Il roleplay e la narrativa creativa sono la seconda categoria più grande e >50% di tutto l'uso open-source. I modelli non censurati stanno assorbendo la domanda per contenuti "fan-fic" e NSFW. 2. La programmazione ora rappresenta >50% di tutti i token LLM. Era l'11% dodici mesi fa. La codifica è letteralmente diventata il sistema operativo dell'AI. 3. Claude di Anthropic è utilizzato per >80% della programmazione e quasi zero roleplay. È il modello per il “lavoro serio” mentre DeepSeek è il re dell'intrattenimento (con 2/3 del traffico di roleplay) 4. Un modello che per primo riesce a gestire un carico di lavoro difficile crea un lock-in quasi permanente. I gruppi di utenti di inizio 2025 di Claude 4 Sonnet e Gemini 2.5 Pro mantengono ancora il 40–50% degli utenti sei mesi dopo, mentre ogni gruppo successivo ha un alto tasso di abbandono. Lo chiamano l'effetto Glass Slipper: essere i primi a adattarsi a un nuovo carico di lavoro, e la principessa non se ne va mai. 5. La domanda è incredibilmente inelastica rispetto al prezzo. Gli utenti pagano felicemente 10–50× di più per token per Claude o GPT-5 se questo consente di risparmiare dieci minuti di debugging. Essere economici non è affatto sufficiente. 6. La nuova dimensione ideale del modello è di 20–70B parametri. I modelli piccoli stanno avendo un basso utilizzo, i modelli giganti si stanno frammentando, e la fascia media sta assorbendo entrambi. 7. I modelli open-source sono passati da <5% a ~33% dell'uso totale in un anno, quasi interamente guidati da laboratori cinesi (DeepSeek, Qwen, Moonshot, MiniMax). Non esiste più un singolo miglior modello. I primi dieci modelli per volume provengono da otto laboratori diversi. 8. L'Asia ora rappresenta il 31% della spesa globale (era il 13% un anno fa). Singapore + Cina + Corea da sole rappresentano quasi il 20% di tutti i token. L'era di un modello fondazionale per dominarli tutti è finita. Viviamo ora in un mondo permanentemente frammentato dove il modello che usi dipende interamente da cosa stai facendo con esso - scrivere codice? scrivere fanfics? Comunque, è chiaro che c'è solo una direzione per la spesa in token: su e a destra. Rapporto completo da @a16z + @OpenRouterAI (link nei commenti).