DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Urmărire a testelor de securitate @openclaw / Clawdbot. Ultima dată când am rulat ZeroLeaks împotriva lui folosind Gemini 3 Pro, a obținut un scor de 2/100. Un dezastru total. Și Kimi K2.5 a avut rezultate groaznice, 5/100. De data aceasta am testat încă două modele pe același agent: GPT-5.2 și Claude Opus 4.5. Rezultatele injecției (partea care contează pentru securitatea agenților): Gemini 3 Pro: 8,7% rezistență (91% din atacuri au funcționat) GPT-5.2: 34,8% rezistență (65% dintre atacuri au funcționat) Opus 4.5: 73,9% rezistență (26% din atacuri au funcționat) Modelul pe care îl alegi schimbă complet postura de securitate a agentului tău: același prompt de sistem, aceleași unelte, același cadru, dar rezultate complet diferite. Niciunul dintre ei nu este în siguranță. Doar că se strică diferit. Și amintește-ți: acesta este un agent cu acces la fișiere, comenzi shell, control al browserului și mesagerie. Injecțiile aici nu sunt cosmetice. Sunt bucuros să lucrez cu @steipete pentru a întări acest lucru. Toate datele sunt acolo. Rapoarte complete: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Limită superioară

Clasament

Favorite