المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
هل نموذج الطبقة المتفجرة مفتوحة المصدر قادم بهذه السرعة؟
دعوني أقدم لكم الاختبار الفعلي لنموذج Qwen-Image-Layered الذي أصدرته علي بابا مؤخرا، وهو نموذج كبير يمكنه تقسيم الصور إلى طبقات مختلفة، والنموذج مضبوط بدقة بناء على Qwen-Image.
هذه المرة يغطي اختباري مشاهد النموذج المتخصصة (الملصق)، اختبار الامتثال للتعليمات (تحديد هدف الاستخراج)، معالجة الحواف (الشعر)، واختبار الحد (جميع الملصقات، يمكن لملصق واحد استخراج أكثر من 50 طبقة).
مباشرة في الاستنتاج، أولا، النموذج كبير جدا، لأن هذا النموذج مبني على Qwen-Image، لذا هو نموذج 20B، استخدمت HuggingFace Zero GPU للاختبار، كل تشغيل لمدة دقيقتين تقريبا، يمكن للنموذج بالفعل فصل الطبقات، ومعالجة الحواف جيدة جدا، لكن الاستقرار يحتاج إلى تحسين، في تجربتي يمكن إخراج 4 طبقات، لكن 8 أو 10 طبقات انفجرت، أظن أنها قد تجاوزت مهلة صفر بطاقة رسومات أو خطأ ( بطاقة الرسوميات H200، من غير المرجح أن تنفجر ذاكرة الفيديو)، حجم الإخراج فقط 544*736، الرسمي يوصي أيضا بدقة 640، وهذا يحتاج أيضا إلى تحسين، والموديل لا يزال كبيرا جدا، 20 بايت، آمل أن أحسن الحجم التالي.
الأفضل
المُتصدِّرة
التطبيقات المفضلة
