Tengo dos GPUs y dos sistemas SFT a la vez con @PrimeIntellect La idea es corregir pasos variando el número de ejemplos y luego probar contra un conjunto de pruebas contenido para ver cómo la diversidad de entradas ayuda a generalizar para un entorno sencillo Verificadores, allá voy~