Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Kontynuacja testów bezpieczeństwa @openclaw / Clawdbot. Ostatnim razem uruchomiłem ZeroLeaks przeciwko temu, używając Gemini 3 Pro, i uzyskałem wynik 2/100. Całkowita katastrofa. Kimi K2.5 również wypadł tragicznie, 5/100. Tym razem przetestowałem dwa inne modele na tym samym agencie: GPT-5.2 i Claude Opus 4.5. Wyniki iniekcji (to, co ma znaczenie dla bezpieczeństwa agenta): Gemini 3 Pro: 8.7% odporności (91% ataków zadziałało) GPT-5.2: 34.8% odporności (65% ataków zadziałało) Opus 4.5: 73.9% odporności (26% ataków zadziałało) Model, który wybierzesz, całkowicie zmienia bezpieczeństwo twojego agenta: ten sam system prompt, te same narzędzia, ta sama struktura, ale zupełnie różne wyniki. Żaden z nich nie jest bezpieczny. Po prostu łamią się w różny sposób. I pamiętaj: to jest agent z dostępem do plików, poleceniami powłoki, kontrolą przeglądarki i wiadomościami. Iniekcje tutaj nie są kosmetyczne. Cieszę się, że mogę współpracować z @steipete nad wzmocnieniem tego. Wszystkie dane są dostępne. Pełne raporty: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Najlepsze

Ranking

Ulubione