J'ai deux GPU et deux exécutions SFT en même temps avec @PrimeIntellect L'idée est de fixer les étapes tout en variant le nombre d'exemples, puis de tester sur un ensemble de test réservé pour voir comment la diversité des entrées aide à généraliser dans un environnement simple. Vérificateurs, me voilà~