Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Menindaklanjuti tes keamanan @openclaw / Clawdbot.
Terakhir kali saya menjalankan ZeroLeaks melawannya menggunakan Gemini 3 Pro, skor itu 2/100. Bencana total. Kimi K2.5 juga mengerikan, 5/100.
Kali ini saya menguji dua model lagi pada agen yang sama: GPT-5.2 dan Claude Opus 4.5.
Hasil injeksi (bagian yang penting untuk keamanan agen):
Gemini 3 Pro: 8,7% resistensi (91% serangan berhasil)
GPT-5.2: resistensi 34,8% (65% serangan berhasil)
Opus 4.5: 73,9% resistensi (26% serangan berhasil)
Model yang Anda pilih benar-benar mengubah postur keamanan agen Anda: prompt sistem yang sama, alat yang sama, kerangka kerja yang sama, tetapi hasil yang sangat berbeda.
Tak satu pun dari mereka yang aman. Mereka hanya merusak secara berbeda. Dan ingat: ini adalah agen dengan akses file, perintah shell, kontrol browser, dan perpesanan. Suntikan di sini tidak kosmetik.
Senang bekerja sama dengan @steipete untuk mengeraskan ini. Semua data ada di sana.
Laporan lengkap:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Teratas
Peringkat
Favorit
