Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
FARMER kombinuje invertovatelný autoregresní tok, který dokáže mapovat obrázky do a z latentního prostoru bez ztráty informace, s autoregresním transformátorem, který modeluje distribuci každého latentního tokenu pomocí Gaussovských směsí a poskytuje přesné pravděpodobnosti v jednostupňovém generátoru na úrovni pixelů.
Přináší tři klíčové novinky:
- Rozdělení kanálů pod vlastním dohledem rozděluje latentní prvky do informativních (ZI) a redundantních (ZR) skupin, čímž efektivně modeluje strukturu a detaily.
- Navádění bez klasifikátoru (CFG) založené na převzorkování zlepšuje kvalitu obrazu a umožňuje kontrolovatelné vzorkování.
- Jednokroková automatická destilace urychluje generování tím, že nahrazuje pomalou sekvenční reverzaci jediným rychlým krokem zpět.
Na ImageNet-256 (podmíněno třídou, 50 tisíc vzorků) dosahuje model 1.9B patch-8 FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51. Po +60 epochách je inference 22× rychlejší při obráceném AF (0,1689 s → 0,0076 s na snímek) a přibližně 4× rychlejší celkově (0,2189 s → 0,0567 s na snímek).
Překonává JetFormer 2.8B (FID 6.64) a TARFlow p8 (4.69) a je konkurenceschopný s STARFlow p8. Varianta STARFlow vyladěná dekodérem (FID 2.40) zůstává silnější, ale používá vícestupňové nastavení.

Top
Hodnocení
Oblíbené

