Jeśli uczysz się LLM, odkryjesz, że dzisiejsi hakerzy są naturalnie SFT, w tamtych czasach uczyłem się bezpieczeństwa bez podręczników, samodzielnie RL, uczyłem się technik penetracji na czarnych stronach, różnica między czystym RL a SFT-RL polega na wyobraźni. RL ma lepszą generalizację, a SFT-RL jest dość tępy. Dlatego hakerzy mogą tylko przypadkowo stworzyć jednego, a nie produkować ich masowo, ci, którzy mogą produkować, to tylko głupcy.