📈Selbstverbessernde Vortraining 📈 ✍️: Erfindet das Vortraining neu: keine Vorhersage des nächsten Tokens mehr! - Nutzt das bestehende LM aus der letzten Selbstverbesserungsiteration, um Belohnungen zu geben, um ein neues Modell auf *Sequenzen* vorzutrainieren - Große Fortschritte in Faktizität, Sicherheit & Qualität 🧵1/5