Największy raport dotyczący wykorzystania AI w 2025 roku właśnie się ukazał (100 bilionów tokenów rzeczywistego użycia na OpenRouter) 8 ustaleń, które najbardziej mnie zaskoczyły: 1. Roleplay i kreatywna fikcja to druga największa kategoria i >50% całkowitego użycia open-source. Modele bez cenzury zaspokajają popyt na "fan-fik" i treści NSFW. 2. Programowanie stanowi teraz >50% wszystkich tokenów LLM. Rok temu było to 11%. Kodowanie dosłownie stało się systemem operacyjnym AI. 3. Claude od Anthropic jest używany do >80% programowania i prawie zero w roleplay. To model do „poważnej pracy”, podczas gdy DeepSeek jest królem rozrywki (z 2/3 ruchu w roleplay) 4. Model, który jako pierwszy poradzi sobie z bolesnym obciążeniem, tworzy niemal trwałe przywiązanie. Wczesne kohorty 2025 roku Claude 4 Sonnet i Gemini 2.5 Pro wciąż utrzymują 40–50% użytkowników sześć miesięcy później, podczas gdy każda późniejsza kohorta odpada. Nazywają to efektem Szklanej Pantofelka: bądź pierwszym, który dopasuje się do nowego obciążenia, a księżniczka nigdy nie odejdzie. 5. Popyt jest szalenie nieelastyczny cenowo. Użytkownicy chętnie płacą 10–50× więcej za tokeny dla Claude lub GPT-5, jeśli zaoszczędzi im to dziesięć minut debugowania. Bycie tanim to zdecydowanie za mało. 6. Nowy optymalny rozmiar modelu to 20–70B parametrów. Małe modele mają niskie wykorzystanie, gigantyczne modele się fragmentują, a średnia klasa zyskuje na obu. 7. Modele open-source wzrosły z <5% do ~33% całkowitego użycia w ciągu jednego roku, niemal całkowicie napędzane przez chińskie laboratoria (DeepSeek, Qwen, Moonshot, MiniMax). Nie ma już jednego najlepszego modelu. Dziesięć najlepszych modeli pod względem wolumenu pochodzi z ośmiu różnych laboratoriów. 8. Azja stanowi teraz 31% globalnych wydatków (było 13% rok temu). Singapur + Chiny + Korea stanowią prawie 20% wszystkich tokenów. Era jednego modelu bazowego, który rządzi wszystkimi, dobiegła końca. Teraz żyjemy w trwale fragmentowanym świecie, w którym model, którego używasz, zależy całkowicie od tego, co z nim robisz - pisanie kodu? pisanie fanfików? Tak czy inaczej, wyraźnie istnieje tylko jeden kierunek wydatków na tokeny: w górę i w prawo Pełny raport od @a16z + @OpenRouterAI (link w komentarzach).