Un nuovo documento analizza i dati sull'uso dell'API LLM di oltre 100T+ token (OpenRouter + Azure). Risultati chiave: - L'offerta è esplosa nel 2025: da 253 a 651 modelli, fornitori di inferenza da 27 a 90, alcuni modelli open-source serviti da oltre 20 fornitori. - Paradosso dei prezzi: deflazione di 1000x dal 2023 SOTA, ma la spesa media per token è stabile. Gli utenti risparmiano acquistando più intelligenza, non più volume. - L'open-source è il 90% più economico a parità di qualità di benchmark, ma detiene meno del 30% di quota. La differenziazione non basata sul prezzo (affidabilità, strumenti, vibrazioni) è reale. - Il tasso di abbandono è estremo: il modello di punta mantiene il vantaggio solo per mesi prima di essere sostituito. I primi 10 di oggi avevano il 20% di quota 4 mesi fa, non esistevano 10 mesi fa. Nessun vincitore che prende tutto. - La disponibilità a pagare varia enormemente a seconda del caso d'uso: SEO paga $1.40/M token, traduzione $0.17, legale $0.16. La maggior parte dell'uso rimane ben al di sotto dell'intelligenza di frontiera. - L'elasticità dei prezzi a breve termine è ~1.1, quindi nessun paradosso di Jevons (ancora). I tagli ai prezzi non innescheranno una domanda esplosiva di calcolo. L'attrito di integrazione è il vincolo principale, non il costo.