Więcej wstępnego szkolenia poprawia wydajność GEN-0 w przypadku rzeczywistych robotów (poprzez ślepe oceny A/B z zamkniętymi pętlami). Ulepszenia są znaczące w reżimie niskich danych, ale najlepsze modele rozwijają się zarówno dzięki wstępnemu szkoleniu, jak i obfitemu szkoleniu po. Zobacz dodatek do bloga: