Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Suivi des tests de sécurité de @openclaw / Clawdbot.
La dernière fois, j'ai exécuté ZeroLeaks contre lui en utilisant Gemini 3 Pro, il a obtenu un score de 2/100. Complète catastrophe. Kimi K2.5 a également fait horrible, 5/100.
Cette fois, j'ai testé deux autres modèles sur le même agent : GPT-5.2 et Claude Opus 4.5.
Résultats d'injection (la partie qui compte pour la sécurité de l'agent) :
Gemini 3 Pro : 8,7 % de résistance (91 % des attaques ont fonctionné)
GPT-5.2 : 34,8 % de résistance (65 % des attaques ont fonctionné)
Opus 4.5 : 73,9 % de résistance (26 % des attaques ont fonctionné)
Le modèle que vous choisissez change complètement la posture de sécurité de votre agent : même invite système, mêmes outils, même cadre, mais des résultats très différents.
Aucun d'eux n'est sûr. Ils se cassent juste différemment. Et rappelez-vous : c'est un agent avec accès aux fichiers, commandes shell, contrôle du navigateur et messagerie. Les injections ici ne sont pas cosmétiques.
Heureux de travailler avec @steipete sur le renforcement de cela. Les données sont toutes là.
Rapports complets :
→ Gemini 3 Pro :
→ GPT-5.2 :
→ Opus 4.5 :



Meilleurs
Classement
Favoris
