Dacă înveți LLM, vei descoperi că hackerii de azi sunt în mod natural SFT, eu nu aveam manuale pentru a învăța securitatea atunci, am învățat propriul meu RL, am spart site-uri pentru a învăța tehnologia de infiltrare, diferența dintre RL pur și SFT-RL este imaginația. RL are o generalizare mai bună, iar SFT-RL are un creier mai tern. Prin urmare, hackerii pot intra în coliziune doar cu un singur RL, dar nu pot fi produși în masă, iar cei care pot produce sunt toți idioți