Новая статья анализирует данные использования API LLM на более чем 100T+ токенов (OpenRouter + Azure). Ключевые выводы: - Предложение взорвалось в 2025 году: 253→651 моделей, провайдеров вывода 27→90, некоторые модели с открытым исходным кодом обслуживаются более чем 20 провайдерами. - Парадокс ценообразования: 1000-кратная дефляция с 2023 года SOTA, но средние расходы на токен остаются на одном уровне. Пользователи экономят, покупая больше интеллекта, а не больший объем. - Модели с открытым исходным кодом на 90% дешевле при эквивалентном качестве бенчмарка, но занимают менее 30% доли. Непоценочная дифференциация (надежность, инструменты, атмосфера) имеет значение. - Текучесть кадров экстремальная: топовая модель удерживает лидерство всего несколько месяцев, прежде чем ее заменят. Сегодняшняя десятка лучших имела 20% доли 4 месяца назад, не существовала 10 месяцев назад. Нет победителя, который забирает все. - Готовность платить сильно варьируется в зависимости от случая использования: SEO платит $1.40 за миллион токенов, перевод $0.17, юридические услуги $0.16. Большинство использования остается значительно ниже предельного интеллекта. - Краткосрочная ценовая эластичность ~1.1, так что парадокса Джевонса (пока) нет. Снижение цен не вызовет взрывного спроса на вычисления. Интеграционные трения являются ограничивающим фактором, а не стоимость.