DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Menindaklanjuti tes keamanan @openclaw / Clawdbot. Terakhir kali saya menjalankan ZeroLeaks melawannya menggunakan Gemini 3 Pro, skor itu 2/100. Bencana total. Kimi K2.5 juga mengerikan, 5/100. Kali ini saya menguji dua model lagi pada agen yang sama: GPT-5.2 dan Claude Opus 4.5. Hasil injeksi (bagian yang penting untuk keamanan agen): Gemini 3 Pro: 8,7% resistensi (91% serangan berhasil) GPT-5.2: resistensi 34,8% (65% serangan berhasil) Opus 4.5: 73,9% resistensi (26% serangan berhasil) Model yang Anda pilih benar-benar mengubah postur keamanan agen Anda: prompt sistem yang sama, alat yang sama, kerangka kerja yang sama, tetapi hasil yang sangat berbeda. Tak satu pun dari mereka yang aman. Mereka hanya merusak secara berbeda. Dan ingat: ini adalah agen dengan akses file, perintah shell, kontrol browser, dan perpesanan. Suntikan di sini tidak kosmetik. Senang bekerja sama dengan @steipete untuk mengeraskan ini. Semua data ada di sana. Laporan lengkap: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Teratas

Peringkat

Favorit