Open source exploded layer model přichází tak brzy? Dovolte mi představit skutečný test modelu Qwen-Image-Layered, který právě vydala Alibaba, což je velký model, který dokáže rozdělit obrázky do různých vrstev a model je doladěn na základě Qwen-Image. Tentokrát můj test pokrývá speciální scény modelu (plakát), test souladu s instrukcemi (specifikujte cíl extrakce), zpracování hran (vlasy) a limit test (všechny samolepky, jedna samolepka dokáže extrahovat více než 50 vrstev). Přímo k závěru, za prvé, model je příliš velký, protože je založen na Qwen-Image, takže je to model 20B, použil jsem k testování HuggingFace Zero GPU, každý běh trvá asi 2 minuty, model skutečně může oddělit vrstvy a edge processing je velmi dobrý, ale stabilita musí být optimalizována, v mém testu lze výstup 4 vrstvy, ale 8 nebo 10 vrstev explodovalo, mám podezření, že to mohlo překročit timeout Zero GPU nebo chyba ( GPU je H200, pravděpodobně neexploduje video paměť), výstupní velikost je jen 544*736, oficiální doporučuje rozlišení 640, i to je potřeba vylepšit, a model je stále příliš velký, 20B, doufám, že optimalizuji další velikost.