Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Follow-up over de beveiligingstests van @openclaw / Clawdbot.
De laatste keer dat ik ZeroLeaks tegen het systeem uitvoerde met Gemini 3 Pro, scoorde het 2/100. Complete ramp. Kimi K2.5 deed het ook vreselijk, 5/100.
Deze keer heb ik twee andere modellen getest op dezelfde agent: GPT-5.2 en Claude Opus 4.5.
Injectieresultaten (het deel dat belangrijk is voor de beveiliging van de agent):
Gemini 3 Pro: 8,7% weerstand (91% van de aanvallen werkte)
GPT-5.2: 34,8% weerstand (65% van de aanvallen werkte)
Opus 4.5: 73,9% weerstand (26% van de aanvallen werkte)
Het model dat je kiest verandert volledig de beveiligingshouding van je agent: dezelfde systeemprompt, dezelfde tools, hetzelfde framework, maar totaal verschillende resultaten.
Geen van hen is veilig. Ze falen gewoon op verschillende manieren. En onthoud: dit is een agent met bestands toegang, shell-opdrachten, browsercontrole en messaging. Injecties hier zijn niet cosmetisch.
Blij om samen te werken met @steipete aan het versterken hiervan. De gegevens zijn allemaal beschikbaar.
Volledige rapporten:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Boven
Positie
Favorieten
