LLMを学べば、今日のハッカーは本質的にSFTであることがわかります。当時はセキュリティを学ぶ教科書はなく、自分で強化学習を学び、ウェブサイトをハッキングして侵入技術を学びました。純粋な強化学習とSFT-RLの違いは想像力です。 強化学習は一般化が優れており、SFT-RLはより鈍い脳を持っています。 したがって、ハッカーは一つの強化学習としか衝突できず、大量生産はできず、生産できる者は皆愚か者です