Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Подальші перевірки тестів безпеки @openclaw / Clawdbot.
Минулого разу, коли я запускав ZeroLeaks на Gemini 3 Pro, результат був 2/100. Повний провал. Kimi K2.5 теж показала жахливі результати — 5/100.
Цього разу я протестував ще дві моделі на тому ж агенті: GPT-5.2 і Claude Opus 4.5.
Результати ін'єкції (частина, яка має значення для безпеки агента):
Gemini 3 Pro: 8,7% опору (91% атак спрацювали)
GPT-5.2: 34,8% опору (65% атак спрацювали)
Опус 4.5: 73,9% опору (26% атак спрацювали)
Обрана вами модель повністю змінює рівень безпеки вашого агента: той самий системний запит, ті ж інструменти, той самий фреймворк, але результати зовсім інші.
Жоден із них не є безпечним. Вони просто ламаються по-різному. І пам'ятайте: це агент із доступом до файлів, shell-командами, керуванням браузером і обміном повідомленнями. Ін'єкції тут не косметичні.
Радий попрацювати з @steipete над загартуванням цього процесу. Всі дані є.
Повні звіти:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Опус 4.5:



Найкращі
Рейтинг
Вибране
