Якщо ви вивчите LLM, то побачите, що сучасні хакери — це природно SFT, у мене тоді не було підручників з безпеки, я вивчив власний RL, зламав сайти, щоб вивчити технології проникнення, різниця між чистим RL і SFT-RL — це уява. RL має кращу узагальненість, а SFT-RL — більш притуплений мозок. Отже, хакери можуть зіткнутися лише з одним RL, але не можуть бути масово створені, а ті, хто може виробляти, — всі ідіоти