Cel mai mare raport de utilizare AI din 2025 tocmai a apărut (100 trilioane de tokenuri de utilizare reală pe OpenRouter) 8 descoperiri care m-au surprins cel mai mult: 1. Roleplay-ul și ficțiunea creativă sunt a doua cea mai mare categorie și >50% din toată utilizarea open-source. Modelele necenzurate înghit cererea pentru conținut "fan-fic" și NSFW. 2. Programarea reprezintă acum >50% din toate tokenurile LLM. A fost 11% acum douăsprezece luni. Programarea a devenit literalmente sistemul de operare al AI. 3. Claude de la Anthropic este folosit pentru >80% programare și aproape zero roleplay. Este modelul "muncă serioasă", în timp ce DeepSeek este regele divertismentului (cu 2/3 trafic de roleplay) 4. Un model în care primul care rezolvă o încărcătură dureroasă creează o blocare aproape permanentă. Cohortele de la începutul anului 2025 ale Claude 4 Sonnet și Gemini 2.5 Pro păstrează încă 40–50% dintre utilizatori după șase luni, în timp ce fiecare cohortă ulterioară se desfășoară. Ei numesc asta efectul Pantoficului de Sticlă: fii prima care acceptă o nouă încărcătură de muncă, iar prințesa nu pleacă niciodată. 5. Cererea este extrem de inelastică din punct de vedere al prețurilor. Utilizatorii plătesc cu plăcere între 10 și 50× mai mult pe token pentru Claude sau GPT-5 dacă astfel economisesc zece minute de depanare. A fi ieftin nu este nici pe departe suficient. 6. Noua dimensiune ideală a modelului este de 20–70B parametri. Modelele mici au o utilizare redusă, modelele uriașe se fragmentează, iar nivelul mediu le consumă pe ambele. 7. Modelele open-source au trecut de la <5% la ~33% din utilizarea totală într-un an, aproape în totalitate generate de laboratoare chineze (DeepSeek, Qwen, Moonshot, MiniMax). Nu mai există un singur model cel mai bun. Top zece modele după volum provin din opt laboratoare diferite. 8. Asia reprezintă acum 31% din cheltuielile globale (era 13% anul trecut). Doar Singapore + China + Coreea reprezintă aproape 20% din toate tokenurile. Era unui singur model de fundație care să le conducă a trecut. Acum trăim într-o lume permanent fragmentată, unde modelul pe care îl folosești depinde în totalitate de ceea ce faci cu el – scrii cod? Scriind fanficuri? Oricum, există clar o singură direcție pentru cheltuielile de jetoane: sus și la dreapta Raport complet de la @a16z + @OpenRouterAI (link în comentarii).