Twee GPU's en twee SFT-runs tegelijkertijd met @PrimeIntellect Het idee is om stappen vast te stellen terwijl het aantal voorbeelden varieert en vervolgens te testen tegen een vastgehouden testset om te zien hoe inputdiversiteit helpt bij generalisatie voor een eenvoudige omgeving. Verifiers, hier kom ik~