Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Почему так быстро появился открытый модельный слой для разложения?
Представляю вам только что выпущенную модель Qwen-Image-Layered от Alibaba, это большая модель, которая может разделять изображения на разные слои, модель основана на дообучении Qwen-Image.
В этом тестировании я охватил сильные стороны этой модели (постеры), тестирование соблюдения инструкций (указание на извлечение цели), обработка краев (волосы), предельное тестирование (все наклейки, если одна наклейка — один слой, можно извлечь более 50 слоев).
Сразу скажу вывод: во-первых, модель слишком большая, так как эта модель основана на Qwen-Image, она имеет 20B, я тестировал с HuggingFace Zero GPU, каждый запуск занимает около 2 минут, модель действительно может разделять слои, и обработка краев довольно хороша, но стабильность требует оптимизации, в моем тестировании 4 слоя можно вывести, но 8 или 10 слоев вылетают, подозреваю, что это может быть связано с превышением времени ожидания Zero GPU или ошибкой (GPU H200, маловероятно, что это проблема с видеопамятью), размер вывода всего 544*736, официально также рекомендуется разрешение 640, это тоже нужно улучшить, и модель все еще слишком большая, 20B, надеюсь, что размеры можно оптимизировать.
Топ
Рейтинг
Избранное
