FLUX.2 [klein] 9B, özellikle birden fazla referans görüntü kullandığınızda, görüntü düzenlemede 2 kat daha hızlı oldu. Aynı kalite, fiyat artışı yok.
Arka planda: KV-önbellekleme, modelin referans görüntülerinizdeki gereksiz hesaplamayı atlamasına olanak tanır. Ne kadar çok referans kullanırsanız, hızlanma o kadar büyük olur. Çoklu referans düzenleme için çıkarım 2 kat+'a kadar daha hızlıdır.
Ayrıca FP8 kuantize ağırlıklarını da piyasaya süreceğiz, bunlar @NVIDIA_AI_PC Klein 9B'yi daha az VRAM'le ve yerel ve kendi kendine barındırılan dağıtımlar için daha hızlı çıkarma ile çalıştırın.
183