Habe zwei GPUs und zwei SFT-Läufe zur gleichen Zeit mit @PrimeIntellect Die Idee ist, die Schritte zu fixieren, während die Anzahl der Beispiele variiert wird, und dann gegen einen zurückgehaltenen Testdatensatz zu testen, um zu sehen, wie die Eingabediversität hilft, in einer einfachen Umgebung zu verallgemeinern. Verifizierer, ich komme~