FLUX.2 [klein] 9B è appena diventato 2 volte più veloce nell'editing delle immagini, specialmente quando utilizzi più immagini di riferimento. Stessa qualità, nessun aumento di prezzo.
Dietro le quinte: la memorizzazione nella cache KV consente al modello di saltare i calcoli ridondanti sulle tue immagini di riferimento. Più riferimenti utilizzi, maggiore è l'accelerazione. L'inferenza è fino a 2 volte più veloce per l'editing con più riferimenti.
Stiamo anche rilasciando pesi quantizzati FP8, costruiti con @NVIDIA_AI_PC Esegui Klein 9B con meno VRAM e inferenza più veloce per distribuzioni locali e auto-ospitate.
181