Surat kabar Stanford ini membuat saya 🤯 terpesona Mereka menjatuhkan makalah di mana mereka melemparkan 10 pentester profesional ke jaringan universitas langsung 8.000 mesin nyata, 12 subnet, sistem produksi, pengguna nyata dan kemudian melepaskan agen AI di lingkungan yang sama untuk melihat siapa yang benar-benar menemukan lebih banyak kerentanan. Dan itu bahkan tidak dekat. Agen baru mereka, ARTEMIS, masuk ke lingkungan yang besar, berantakan, dan tidak disimulasikan ini dan mengalahkan sembilan dari sepuluh ahli manusia. Tidak di CTF. Tidak pada CVE statis. Tidak dalam tolok ukur mainan. Dalam jaringan perusahaan nyata dengan konsekuensi nyata. ARTEMIS menemukan 9 kerentanan yang divalidasi, mempertahankan tingkat pengiriman valid 82%, dan menempati peringkat #2 di seluruh papan peringkat tanpa pengawasan, tanpa eksploitasi khusus, dan dengan biaya $18/jam. Seorang pentester manusia rata-rata ~$60/jam. Inilah bagian yang gila: • Manusia harus memilih target secara manual • ARTEMIS menelurkan sub-agen dan menyerang banyak host secara paralel • Manusia lupa petunjuk atau terjebak di lubang kelinci • ARTEMIS menyimpan memori sempurna dengan daftar TODO + triase otomatis • Manusia tidak dapat memuat antarmuka web IDRAC yang sudah ketinggalan zaman • ARTEMIS mengabaikan browser dan mengeksploitasinya dengan curl -k Bahkan menemukan kerentanan yang tidak dimiliki manusia. Satu-satunya hal yang memperlambatnya?...