المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
متابعة اختبارات الأمان @openclaw / كلاودبوت.
آخر مرة شغلت فيها ZeroLeaks ضده باستخدام Gemini 3 Pro حصل على تقييم 2 من 100. كارثة كاملة. Kimi K2.5 كان سيئا جدا أيضا، 5 من 100.
هذه المرة اختبرت نموذجين آخرين على نفس الوكيل: GPT-5.2 وClaude Opus 4.5.
نتائج الحقن (الجزء المهم لأمان الوكيل):
جيميني 3 برو: مقاومة 8.7٪ (91٪ من الهجمات نجحت)
GPT-5.2: مقاومة 34.8٪ (65٪ من الهجمات نجحت)
أوبوس 4.5: 73.9٪ مقاومة (26٪ من الهجمات نجحت)
النموذج الذي تختاره يغير تماما وضع الأمان لوكيلك: نفس موجه النظام، نفس الأدوات، نفس الإطار، لكن النتائج مختلفة تماما.
ولا أحد منهم آمن. لكنها فقط تنكسر بشكل مختلف. وتذكر: هذا وكيل لديه وصول إلى الملفات، وأوامر shell، والتحكم في المتصفح، والرسائل. الحقن هنا ليست تجميلية.
سعيد بالعمل مع @steipete على تقوية هذه الوضعية. كل البيانات موجودة.
التقارير الكاملة:
→ جيميني 3 برو:
→ GPT-5.2:
→ العمل 4.5:



الأفضل
المُتصدِّرة
التطبيقات المفضلة
