Ця стаття Стенфорда вразила мене 🤯 Вони опублікували статтю, де кинули 10 професійних пентестерів у живу університетську мережу — 8 000 реальних машин, 12 підмереж, виробничих систем, реальних користувачів, а потім випустили агентів ШІ на те саме середовище, щоб побачити, хто насправді знайде більше вразливостей. І це було навіть близько не так. Їхній новий агент, ARTEMIS, увійшов у це величезне, хаотичне, несимуляцене середовище і переміг дев'ять із десяти людських експертів. Не в CTF. Не на статичних CVE. Не в іграшковому бенчмарку. У реальній корпоративній мережі з реальними наслідками. ARTEMIS виявив 9 перевірених вразливостей, підтримував 82% валідних подань і посів #2 місце у всій таблиці лідерів без нагляду, без кастомних експлойтів і за вартістю $18 на годину. Людський пентестер у середньому коштує ~60 доларів на годину. Ось у чому неймовірна частина: • Люди мусили обирати цілі вручну • ARTEMIS створювала субагентів і атакувала кілька хостів одночасно • Люди забували поводки або застрягали в кролячих норах • ARTEMIS зберігав ідеальну пам'ять за допомогою списків завдань + автосортування • Люди не могли завантажувати застарілі веб-інтерфейси IDRAC • ARTEMIS ігнорував браузер і експлуатував його за допомогою curl -k Вона навіть виявила вразливості, яких не бачила жодна людина. Єдине, що його сповільнювало?...