Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tinker de Thinking Machines siendo GA es uno de los primeros lanzamientos en un tiempo que realmente se siente como un producto de entrenamiento.
La mayoría de las APIs de ajuste fino alojadas (incluidas las de estilo OpenAI) son increíbles cuando todo lo que necesitas es una ejecución limpia de SFT, pero en el momento en que quieres hacer algo incluso ligeramente picante: currículos personalizados, evaluación en línea, post-entrenamiento con recompensas, bucles similares a RL, trucos extraños de agrupamiento/empaquetado: llegas al límite rápidamente y terminas reconstruyendo la mitad de una pila de entrenamiento.
Tinker básicamente invierte eso: te entrega una API de entrenamiento con primitivas de bajo nivel (muestra / forward_backward / optim_step / save_state), así que escribes el bucle que realmente quieres, y ellos se encargan de las partes que normalmente se convierten en un mes de trabajo de infraestructura (programación, escalado, preempciones, recuperación de fallos, el por qué de que este trabajo murió al 93%).
También es LoRA-prioritario, que es exactamente el predeterminado correcto para la personalización: iteras más rápido, los costos se mantienen razonables, puedes mantener múltiples variantes sin duplicar enormes puntos de control, y el servicio se vuelve mucho más práctico. También me gusta que la historia no es vaga: LoRA realmente puede igualar el ajuste fino completo en muchos conjuntos de datos post-entrenamiento cuando lo configuras correctamente, pero si intentas meter un cambio de comportamiento masivo en un adaptador pequeño (o tu conjunto de datos simplemente supera la capacidad efectiva del adaptador), sentirás ese cuello de botella y no desaparecerá mágicamente.
La única desventaja real que veo es el límite de modelos pequeños: si tu objetivo son SLMs pequeños de borde, probablemente esta no sea la herramienta. Aún así, estoy emocionado por ello. No puedo esperar a ver qué construyen las personas.
Parte superior
Clasificación
Favoritos
