DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Aggiornamento sui test di sicurezza di @openclaw / Clawdbot. L'ultima volta che ho eseguito ZeroLeaks contro di esso utilizzando Gemini 3 Pro ha ottenuto 2/100. Un completo disastro. Kimi K2.5 ha fatto orribilmente anche, 5/100. Questa volta ho testato altri due modelli sullo stesso agente: GPT-5.2 e Claude Opus 4.5. Risultati delle iniezioni (la parte che conta per la sicurezza dell'agente): Gemini 3 Pro: 8.7% di resistenza (il 91% degli attacchi ha funzionato) GPT-5.2: 34.8% di resistenza (il 65% degli attacchi ha funzionato) Opus 4.5: 73.9% di resistenza (il 26% degli attacchi ha funzionato) Il modello che scegli cambia completamente la postura di sicurezza del tuo agente: stesso prompt di sistema, stessi strumenti, stesso framework, ma risultati completamente diversi. Nessuno di loro è sicuro. Semplicemente si rompono in modo diverso. E ricorda: questo è un agente con accesso ai file, comandi shell, controllo del browser e messaggistica. Le iniezioni qui non sono cosmetiche. Felice di lavorare con @steipete per rafforzare questo. I dati sono tutti lì. Rapporti completi: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Principali

Ranking

Preferiti