Om du lär dig LLM kommer du att upptäcka att dagens hackare naturligt är SFT, jag hade inga läroböcker för att lära mig säkerhet då, jag lärde mig min egen RL, jag hackade webbplatser för att lära mig infiltrationsteknologi, skillnaden mellan ren RL och SFT-RL är fantasi. RL har bättre generalisering, och SFT-RL har en mer trög hjärna. Därför kan hackare bara kollidera med en RL, men kan inte massproduceras, och de som kan producera är alla idioter