Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Kontynuacja testów bezpieczeństwa @openclaw / Clawdbot.
Ostatnim razem uruchomiłem ZeroLeaks przeciwko temu, używając Gemini 3 Pro, i uzyskałem wynik 2/100. Całkowita katastrofa. Kimi K2.5 również wypadł tragicznie, 5/100.
Tym razem przetestowałem dwa inne modele na tym samym agencie: GPT-5.2 i Claude Opus 4.5.
Wyniki iniekcji (to, co ma znaczenie dla bezpieczeństwa agenta):
Gemini 3 Pro: 8.7% odporności (91% ataków zadziałało)
GPT-5.2: 34.8% odporności (65% ataków zadziałało)
Opus 4.5: 73.9% odporności (26% ataków zadziałało)
Model, który wybierzesz, całkowicie zmienia bezpieczeństwo twojego agenta: ten sam system prompt, te same narzędzia, ta sama struktura, ale zupełnie różne wyniki.
Żaden z nich nie jest bezpieczny. Po prostu łamią się w różny sposób. I pamiętaj: to jest agent z dostępem do plików, poleceniami powłoki, kontrolą przeglądarki i wiadomościami. Iniekcje tutaj nie są kosmetyczne.
Cieszę się, że mogę współpracować z @steipete nad wzmocnieniem tego. Wszystkie dane są dostępne.
Pełne raporty:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Najlepsze
Ranking
Ulubione
