FLUX.2 [klein] 9B właśnie stał się 2x szybszy w edytowaniu obrazów, szczególnie gdy używasz wielu obrazów referencyjnych. Ta sama jakość, brak podwyżki cen.
Pod maską: KV-caching pozwala modelowi pomijać zbędne obliczenia na twoich obrazach referencyjnych. Im więcej referencji używasz, tym większy przyspieszenie. Wnioskowanie jest do 2x+ szybsze przy edytowaniu z wieloma referencjami.
Wydajemy również wagi skwantyzowane FP8, stworzone z @NVIDIA_AI_PC Uruchom Klein 9B z mniejszym zużyciem VRAM i szybszym wnioskowaniem dla lokalnych i samodzielnych wdrożeń.
184