FLUX.2 [klein] 9B стал в 2 раза быстрее в редактировании изображений, особенно когда вы используете несколько эталонных изображений. То же качество, без увеличения цены.
Под капотом: KV-кэширование позволяет модели пропускать избыточные вычисления на ваших эталонных изображениях. Чем больше эталонов вы используете, тем больше ускорение. Инференс в 2 раза быстрее для редактирования с несколькими эталонами.
Мы также выпускаем веса, квантизированные с помощью FP8, созданные с @NVIDIA_AI_PC Запускайте Klein 9B с меньшим объемом VRAM и более быстрой инференцией для локальных и саморазмещенных развертываний.
181