Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Urmărire a testelor de securitate @openclaw / Clawdbot.
Ultima dată când am rulat ZeroLeaks împotriva lui folosind Gemini 3 Pro, a obținut un scor de 2/100. Un dezastru total. Și Kimi K2.5 a avut rezultate groaznice, 5/100.
De data aceasta am testat încă două modele pe același agent: GPT-5.2 și Claude Opus 4.5.
Rezultatele injecției (partea care contează pentru securitatea agenților):
Gemini 3 Pro: 8,7% rezistență (91% din atacuri au funcționat)
GPT-5.2: 34,8% rezistență (65% dintre atacuri au funcționat)
Opus 4.5: 73,9% rezistență (26% din atacuri au funcționat)
Modelul pe care îl alegi schimbă complet postura de securitate a agentului tău: același prompt de sistem, aceleași unelte, același cadru, dar rezultate complet diferite.
Niciunul dintre ei nu este în siguranță. Doar că se strică diferit. Și amintește-ți: acesta este un agent cu acces la fișiere, comenzi shell, control al browserului și mesagerie. Injecțiile aici nu sunt cosmetice.
Sunt bucuros să lucrez cu @steipete pentru a întări acest lucru. Toate datele sunt acolo.
Rapoarte complete:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Limită superioară
Clasament
Favorite
