Открытые модели показывают скорость в 2,5 раза выше, в 6 раз дороже Меньший размер пакета, спекулятивное декодирование сложнее Параметрическая оптимальная кривая для Deepseek показывает это Claude Opus 4.6 — 100 Ток/с/пользователь Deepseek на 100 — 6k Ток/с/ГПУ При 250 ток/с/пользователь это ближе к 1k