Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nachverfolgung der Sicherheitsprüfungen von @openclaw / Clawdbot.
Beim letzten Mal habe ich ZeroLeaks gegen es mit Gemini 3 Pro getestet, es erzielte 2/100. Vollständige Katastrophe. Kimi K2.5 schnitt ebenfalls schlecht ab, 5/100.
Diesmal habe ich zwei weitere Modelle mit demselben Agenten getestet: GPT-5.2 und Claude Opus 4.5.
Injection-Ergebnisse (der Teil, der für die Sicherheit des Agenten wichtig ist):
Gemini 3 Pro: 8,7% Widerstand (91% der Angriffe funktionierten)
GPT-5.2: 34,8% Widerstand (65% der Angriffe funktionierten)
Opus 4.5: 73,9% Widerstand (26% der Angriffe funktionierten)
Das Modell, das du wählst, verändert die Sicherheitslage deines Agenten vollständig: dasselbe System-Prompt, dieselben Werkzeuge, dasselbe Framework, aber völlig unterschiedliche Ergebnisse.
Keines von ihnen ist sicher. Sie brechen nur unterschiedlich. Und denk daran: dies ist ein Agent mit Dateizugriff, Shell-Befehlen, Browserkontrolle und Messaging. Injektionen hier sind nicht kosmetisch.
Ich freue mich darauf, mit @steipete an der Härtung zu arbeiten. Die Daten sind alle vorhanden.
Vollständige Berichte:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Top
Ranking
Favoriten
