Den efterlängtade hostade RL-träningen från @PrimeIntellect är ute, under den senaste månaden /med beta har jag tränat 50+ modeller på både community-miljöer och min pmpp som alla finns tillgängliga på miljöhubben. Att gå e2e från signal till modell, allt inne i labbet, var den smidigaste träningsupplevelsen jag någonsin haft