Un nou articol analizează 100T+ tokenuri de utilizare a API-ului LLM (OpenRouter + Azure). Constatări cheie: - Oferta a explodat în 2025: 253→651 modele, furnizori de inferență 27→90, unele modele open-source deservite de 20+ furnizori -Paradoxul prețurilor: deflație de 1000x de la SOTA din 2023, dar cheltuielile medii pe token sunt constante. Utilizatorii economisesc cumpărând mai multă inteligență, nu mai mult volum. -Open-source este cu 90% mai ieftin la calitate echivalentă a benchmark-urilor, dar deține <30% cotă. Diferențierea non-prețului (fiabilitate, scule, vibrații) este reală. -Churn-ul este extrem: modelul de top păstrează plumbul doar luni de zile înainte de deplasare. Top 10 de astăzi avea o cotă de 20% acum 4 luni, nu exista acum 10 luni. Niciun câștigător ia totul. -Disponibilitatea de plată variază foarte mult în funcție de caz de utilizare: SEO plătește 1,40$/M token-uri, traducerea $0,17, legalul 0,16$. Majoritatea utilizărilor rămân mult sub inteligența de frontieră. -Elasticitatea prețului pe termen scurt ~1,1, deci nu există paradoxul Jevons (încă). Reducerile de preț nu vor declanșa o cerere explozivă de calcul. Frecarea de integrare este constrângerea de legare, nu costul.