Ho due GPU e due esecuzioni SFT contemporaneamente con @PrimeIntellect L'idea è di fissare i passaggi variando il numero di esempi e poi testare su un set di test riservato per vedere come la diversità degli input aiuta a generalizzare in un ambiente semplice verificatori, eccomi~