Die nächsten Videos werden sich mit der Feinabstimmung von SLMs beschäftigen.❤️‍🔥 - Ursprünglich wollte ich ein 60-minütiges Video über die Modellentwicklung nach dem Pretraining (CPT, Midtraining, SFT, RLHF, RLVR) machen. - Aber das würde Monate dauern, also mache ich stattdessen eine Mini-Serie mit ~20-minütigen Videos. - Unsloth durchgehend mit etwas HF und Pytorch, wo nötig. Der RL-Teil wird Prime Labs verwenden. - Abgesehen vom Code wird der Hauptfokus auf Datensätzen liegen. Identifizierung von OS-Datensätzen, Vorbereitung, Generierung synthetischer Datensätze für das Training usw. - Ein weiteres großes Thema wird die Evaluation sein. Einrichtung von Harnesses für Metriken. - Die Themen der späteren Videos sind noch nicht vollständig geplant, der Screenshot ist ein grundlegender Fahrplan. Ich werde es nach dem Gehör spielen, je nachdem, welche Fragen ich von euch bekomme! - Ich werde auf jeden Fall auch an anderen Videos dazwischen arbeiten. Wenn mein Geist abschweift, lasse ich es zu. Aber ich hoffe, ich schaffe es, es in den nächsten 3 Monaten oder so abzuschließen. Es hängt alles von meinem Vergnügen ab, was sonst in der Welt passiert und was mein Publikum ansprechen möchte. Das gesagt, mein nächstes Video wird zu 100 % über das fortgesetzte Pretraining auf benutzerdefinierten Datensätzen sein.