Tengo dos GPUs y dos ejecuciones de SFT al mismo tiempo con @PrimeIntellect La idea es fijar los pasos mientras se varía el número de ejemplos y luego probar contra un conjunto de prueba reservado para ver cómo la diversidad de entrada ayuda a generalizar en un entorno simple ¡Verificadores, allá voy~