Als je LLM hebt bestudeerd, zul je ontdekken dat de huidige hackers van nature SFT zijn. In mijn tijd had ik geen lesmateriaal om beveiliging te leren, ik deed het zelf met RL, leerde penetratietechnieken op het dark web. Het verschil tussen pure RL en SFT-RL ligt in de verbeeldingskracht. RL heeft een betere generalisatie, terwijl SFT-RL wat dommer is. Daarom kan een hacker alleen door RL iets creëren, maar niet in massa produceren; wat geproduceerd kan worden, zijn domme mensen.