Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Följ upp säkerhetstesterna på @openclaw / Clawdbot.
Senast jag körde ZeroLeaks mot det med Gemini 3 Pro fick det 2/100. Fullständig katastrof. Kimi K2.5 gick också fruktansvärt dåligt, 5/100.
Den här gången testade jag två modeller till på samma agent: GPT-5.2 och Claude Opus 4.5.
Injektionsresultat (den del som är viktig för agentsäkerhet):
Gemini 3 Pro: 8,7 % motstånd (91 % av attackerna fungerade)
GPT-5.2: 34,8 % motstånd (65 % av attackerna fungerade)
Opus 4.5: 73,9 % motstånd (26 % av attackerna fungerade)
Den modell du väljer förändrar helt din agents säkerhetsnivå: samma systemprompt, samma verktyg, samma ramverk, men helt olika resultat.
Ingen av dem är säker. De går bara sönder på olika sätt. Och kom ihåg: detta är en agent med filåtkomst, shell-kommandon, webbläsarkontroll och meddelanden. Injektionerna här är inte kosmetiska.
Hjälper gärna @steipete till att härda detta. Allt finns där.
Fullständiga rapporter:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Topp
Rankning
Favoriter
