Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vi har ett allvarligt problem med finjustering.
Alla som försöker göra SFT eller RL idag tvingas till en av två ytterligheter:
1. "Lättanvända" API:er som ger dig nästan ingen kontroll över träningsprocessen.
2. Fullskalig infrastrukturhelvete, där du hanterar checkpoints, råa GPU:er, omförsök, inaktiva kostnader och oändlig rördragning.
Det finns väldigt lite däremellan.
Jag har pratat med några lag som måste välja det mindre onda av dessa två saker. De flesta spenderar massor av pengar på personer som kan hantera infrastruktur eftersom de inte har något annat val.
Här är ett annat alternativ:
HPC-AI-teamet har precis släppt ett finjusterings-SDK som ger dig full kontroll över din träningskod utan att behöva hantera infrastrukturhelvete:
• Du får anpassade SFT-recept
• RL eller RLVR (förstärkningsinlärning med verifierbara belöningar)
• Du kan använda dina egna belöningsfunktioner
• Du kan använda dina egna träningsloopar
De hanterar allt på infrastruktursidan:
• Du rör aldrig Kubernetes-konfigurationer
• Du rör aldrig klusterschemaläggare
• Du rör aldrig GPU-provisionering
• Du rör aldrig distribuerad checkpoint-VVS
Detta öppnar upp för finjustering till många fler team.
Du behöver inte längre välja mellan "för enkelt för att vara användbart" och "så komplext att det är en mardröm."
Huvudidén här är mycket enkel: Denna modell frikopplar algoritmdesign från infrastrukturteknik.
Det finns något mer:
Med denna modell betalar du per token istället för att hyra GPU:er per timme och hantera inaktiva kluster.
Om du vill prova detta kan du registrera dig med en kod som teamet delade med mig (inbäddad i länken nedan):
Denna kod ger dig 10 dollar i gratis vouchers (ungefär 1,5 miljoner tokens) för att driva ditt första utbildningsjobb.
Och här är GitHub-arkivet med SDK:n:
Tack till HPC-AI-teamet för samarbetet med mig i detta inlägg.
416
Topp
Rankning
Favoriter
