Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tenemos un problema serio con el ajuste fino.
Cualquiera que intente hacer SFT o RL hoy en día se ve obligado a uno de dos extremos:
1. APIs "fáciles de usar" que te dan casi ningún control sobre el proceso de entrenamiento.
2. Un infierno total de infraestructura, donde tienes que lidiar con puntos de control, GPUs sin control, reintentos, costes de reposo y fontanería interminable.
Hay muy poco término medio.
He hablado con algunos equipos que tienen que elegir el menor de estos dos males. La mayoría acaba gastando mucho dinero en gente que puede manejar infraestructuras porque no tienen otra opción.
Aquí hay una alternativa diferente:
El equipo de HPC-AI acaba de lanzar un SDK de ajuste que te da control total sobre tu código de entrenamiento sin lidiar con el infierno de la infraestructura:
• Tienes recetas personalizadas de SFT
• RL o RLVR (Aprendizaje por refuerzo con recompensas verificables)
• Puedes usar tus propias funciones de recompensa
• Puedes usar tus propios bucles de entrenamiento
Se encargan de todo en el área de infraestructura:
• Nunca tocas las configuraciones de Kubernetes
• Nunca tocas los planificadores de clústeres
• Nunca tocas el aprovisionamiento de GPU
• Nunca tocas la fontanería distribuida en puntos de control
Esto abre el ajuste fino a muchos más equipos.
Ya no tienes que elegir entre "demasiado simple para ser útil" y "tan complejo que es una pesadilla".
La idea clave aquí es muy sencilla: este modelo desacopla el diseño de algoritmos de la ingeniería de infraestructuras.
Hay algo más:
Con este modelo, pagas por token en lugar de alquilar GPUs por horas y lidiar con clústeres inactivos.
Si quieres probar esto, puedes registrarte con un código que el equipo me ha compartido (incrustado en el enlace de abajo):
Este código te dará 10 dólares en vales gratuitos (aproximadamente 1,5 millones de fichas) para realizar tu primer trabajo de formación.
Y aquí está el repositorio de GitHub con el SDK:
Gracias al equipo de HPC-AI por colaborar conmigo en esta publicación.
412
Populares
Ranking
Favoritas
