Сжатие моделей ИИ только что сделало ончейн-инференс экономически жизнеспособным впервые. Запуск модели с 7 миллиардами параметров раньше стоил $2-3 за вызов инференса, если учитывать газовые сборы и накладные расходы на вычисления. Эта цена делает любое потребительское приложение ИИ мёртвым при рождении. Невозможно создать чат-бота, который будет стоить пользователям $2 за сообщение. Экономика никогда не работала. Техники квантизации и обрезки сжимают модели до 1-2 миллиардов параметров без значительной потери точности. Внезапно стоимость инференса падает до $0.10-0.20 за вызов. Всё ещё не бесплатно, но теперь вы находитесь в диапазоне, где модели микроплатежей становятся жизнеспособными. Пользователи могут платить доли цента за взаимодействие, разработчики могут покрывать расходы без субсидий венчурного капитала, и экономика единиц действительно сходится. Когда инференс становится достаточно дешевым, чтобы поддерживать реальные приложения, а не только демонстрации, вы открываете совершенно другое пространство дизайна. ИИ-агенты, которые полностью живут в ончейне, взаимодействуют с пользователями непрерывно и не требуют централизованных зависимостей API. Вот тогда DeAI перестаёт быть исследовательским проектом и начинает быть инфраструктурой. Смотрите 0G.