Почему так быстро появился открытый модельный слой для разложения? Представляю вам только что выпущенную модель Qwen-Image-Layered от Alibaba, это большая модель, которая может разделять изображения на разные слои, модель основана на дообучении Qwen-Image. В этом тестировании я охватил сильные стороны этой модели (постеры), тестирование соблюдения инструкций (указание на извлечение цели), обработка краев (волосы), предельное тестирование (все наклейки, если одна наклейка — один слой, можно извлечь более 50 слоев). Сразу скажу вывод: во-первых, модель слишком большая, так как эта модель основана на Qwen-Image, она имеет 20B, я тестировал с HuggingFace Zero GPU, каждый запуск занимает около 2 минут, модель действительно может разделять слои, и обработка краев довольно хороша, но стабильность требует оптимизации, в моем тестировании 4 слоя можно вывести, но 8 или 10 слоев вылетают, подозреваю, что это может быть связано с превышением времени ожидания Zero GPU или ошибкой (GPU H200, маловероятно, что это проблема с видеопамятью), размер вывода всего 544*736, официально также рекомендуется разрешение 640, это тоже нужно улучшить, и модель все еще слишком большая, 20B, надеюсь, что размеры можно оптимизировать.