Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Обновление по тестам безопасности @openclaw / Clawdbot.
В прошлый раз, когда я запускал ZeroLeaks против него, используя Gemini 3 Pro, он набрал 2/100. Полный провал. Kimi K2.5 тоже показал ужасные результаты, 5/100.
На этот раз я протестировал две модели на том же агенте: GPT-5.2 и Claude Opus 4.5.
Результаты инъекций (то, что важно для безопасности агента):
Gemini 3 Pro: 8.7% сопротивляемости (91% атак сработали)
GPT-5.2: 34.8% сопротивляемости (65% атак сработали)
Opus 4.5: 73.9% сопротивляемости (26% атак сработали)
Выбор модели полностью меняет безопасность вашего агента: один и тот же системный запрос, одни и те же инструменты, одна и та же структура, но совершенно разные результаты.
Ни один из них не безопасен. Они просто ломаются по-разному. И помните: это агент с доступом к файлам, командами оболочки, управлением браузером и сообщениями. Инъекции здесь не косметические.
Рад работать с @steipete над укреплением этого. Данные все там.
Полные отчеты:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Топ
Рейтинг
Избранное
