Vi använder @PrimeIntellect för hela vår RL-pipeline på GLM 4.6V och Nemotron Security finetunes och min övertygelse har aldrig varit så stark, det är bara så enkelt Prime-RL + verifierare + miljöhubb + hostad träning (använder inte eftersom jag har modala krediter 😋 men det är toppen) och du kan bokstavligen träna dina modeller på vad som helst och bara komma igång på under 15 minuter, om inte snabbare,