questo è fantastico. prevedo che entro maggio 2026 chiunque sarà in grado di addestrare un modello personalizzato come questo per ~qualsiasi compito tramite una combinazione di prime-rl/verifiers, tinker, skyRL, slime ecc. il vantaggio competitivo sarà sapere quale compito addestrare con RL e la magia dei dati/ambienti.