Fikk to GPU-er og to SFT-kjøringer samtidig med @PrimeIntellect Ideen er å fikse trinn mens man varierer antall eksempler, og deretter teste mot et utsatt testsett for å se hvordan inputdiversitet hjelper til med å generalisere for et enkelt miljø Verifikatorer, her kommer jeg~