DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Följ upp säkerhetstesterna på @openclaw / Clawdbot. Senast jag körde ZeroLeaks mot det med Gemini 3 Pro fick det 2/100. Fullständig katastrof. Kimi K2.5 gick också fruktansvärt dåligt, 5/100. Den här gången testade jag två modeller till på samma agent: GPT-5.2 och Claude Opus 4.5. Injektionsresultat (den del som är viktig för agentsäkerhet): Gemini 3 Pro: 8,7 % motstånd (91 % av attackerna fungerade) GPT-5.2: 34,8 % motstånd (65 % av attackerna fungerade) Opus 4.5: 73,9 % motstånd (26 % av attackerna fungerade) Den modell du väljer förändrar helt din agents säkerhetsnivå: samma systemprompt, samma verktyg, samma ramverk, men helt olika resultat. Ingen av dem är säker. De går bara sönder på olika sätt. Och kom ihåg: detta är en agent med filåtkomst, shell-kommandon, webbläsarkontroll och meddelanden. Injektionerna här är inte kosmetiska. Hjälper gärna @steipete till att härda detta. Allt finns där. Fullständiga rapporter: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Topp

Rankning

Favoriter