utiliser @PrimeIntellect pour notre pipeline rl entier sur glm 4.6v et les ajustements de sécurité nemotron et mon engagement n'a jamais été aussi fort, c'est tellement simple prime-rl + vérificateurs + hub d'environnement + formation hébergée (je ne l'utilise pas car j'ai des crédits modal 😋 mais c'est génial) et vous pouvez littéralement entraîner vos modèles sur n'importe quoi et commencer en moins de 15 minutes, si ce n'est plus vite.