Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tinker de Thinking Machines siendo GA es uno de los primeros lanzamientos en mucho tiempo que realmente se siente como un producto de entrenamiento.
La mayoría de las APIs de ajuste fino alojadas (incluida la de OpenAI) son geniales cuando solo necesitas una partida limpia de SFT, pero en cuanto quieres hacer algo aunque sea un poco picante: currículos personalizados, evaluación online, postentrenamiento con forma de recompensa, bucles tipo RL, trucos raros de agrupación/empaquetado: llegas rápido al límite y acabas reconstruyendo la mitad de una pila de entrenamiento.
Tinker básicamente invierte eso: te da una API de entrenamiento con primitivas de bajo nivel (ejemplo / forward_backward / optim_step / save_state), así que escribes el bucle que realmente quieres y ellos se encargan de las partes que normalmente se convierten en un mes de trabajo de infraestructura (planificación, escalado, preempciones, recuperación de fallos, y por qué murió este trabajo al 93%).
Además, es LoRA-primero, que es exactamente el valor por defecto para personalización: iteras más rápido, los costes se mantienen normales, puedes mantener varias variantes sin duplicar enormes puntos de control y el servicio se vuelve mucho más práctico. También me gusta que la historia no sea vaga: LoRA realmente puede igualar el ajuste fino completo en muchos conjuntos de datos post-entrenamiento cuando lo configuras bien, pero si intentas meter un cambio de comportamiento masivo en un adaptador pequeño (o tu conjunto de datos simplemente supera con creces la capacidad efectiva del adaptador), notarás ese cuello de botella y no desaparecerá mágicamente.
El único inconveniente real que veo es el suelo de modelos pequeños: si tu objetivo son SLMs de borde pequeño, probablemente esta no sea la herramienta adecuada. Aun así, estoy emocionado por ello. Estoy deseando ver qué construye la gente.
Populares
Ranking
Favoritas
