DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Follow-up over de beveiligingstests van @openclaw / Clawdbot. De laatste keer dat ik ZeroLeaks tegen het systeem uitvoerde met Gemini 3 Pro, scoorde het 2/100. Complete ramp. Kimi K2.5 deed het ook vreselijk, 5/100. Deze keer heb ik twee andere modellen getest op dezelfde agent: GPT-5.2 en Claude Opus 4.5. Injectieresultaten (het deel dat belangrijk is voor de beveiliging van de agent): Gemini 3 Pro: 8,7% weerstand (91% van de aanvallen werkte) GPT-5.2: 34,8% weerstand (65% van de aanvallen werkte) Opus 4.5: 73,9% weerstand (26% van de aanvallen werkte) Het model dat je kiest verandert volledig de beveiligingshouding van je agent: dezelfde systeemprompt, dezelfde tools, hetzelfde framework, maar totaal verschillende resultaten. Geen van hen is veilig. Ze falen gewoon op verschillende manieren. En onthoud: dit is een agent met bestands toegang, shell-opdrachten, browsercontrole en messaging. Injecties hier zijn niet cosmetisch. Blij om samen te werken met @steipete aan het versterken hiervan. De gegevens zijn allemaal beschikbaar. Volledige rapporten: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Boven

Positie

Favorieten