Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Aggiornamento sui test di sicurezza di @openclaw / Clawdbot.
L'ultima volta che ho eseguito ZeroLeaks contro di esso utilizzando Gemini 3 Pro ha ottenuto 2/100. Un completo disastro. Kimi K2.5 ha fatto orribilmente anche, 5/100.
Questa volta ho testato altri due modelli sullo stesso agente: GPT-5.2 e Claude Opus 4.5.
Risultati delle iniezioni (la parte che conta per la sicurezza dell'agente):
Gemini 3 Pro: 8.7% di resistenza (il 91% degli attacchi ha funzionato)
GPT-5.2: 34.8% di resistenza (il 65% degli attacchi ha funzionato)
Opus 4.5: 73.9% di resistenza (il 26% degli attacchi ha funzionato)
Il modello che scegli cambia completamente la postura di sicurezza del tuo agente: stesso prompt di sistema, stessi strumenti, stesso framework, ma risultati completamente diversi.
Nessuno di loro è sicuro. Semplicemente si rompono in modo diverso. E ricorda: questo è un agente con accesso ai file, comandi shell, controllo del browser e messaggistica. Le iniezioni qui non sono cosmetiche.
Felice di lavorare con @steipete per rafforzare questo. I dati sono tutti lì.
Rapporti completi:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Principali
Ranking
Preferiti
