Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Avem o problemă serioasă cu reglajele fine.
Oricine încearcă astăzi să facă SFT sau RL este forțat să ajungă la una dintre cele două extreme:
1. API-uri "ușor de folosit" care îți oferă aproape niciun control asupra procesului de instruire.
2. Iadul complet al infrastructurii, unde te ocupi de puncte de control, GPU-uri brute, încercări, costuri de repaus și instalații sanitare nesfârșite.
Există foarte puține lucruri între ele.
Am vorbit cu câteva echipe care trebuie să aleagă cel mai mic dintre aceste două rele. Majoritatea ajung să cheltuiască o grămadă de bani pe oameni care pot gestiona infrastructura pentru că nu au altă opțiune.
Iată o alternativă diferită:
Echipa HPC-AI tocmai a lansat un SDK de ajustare fină care îți oferă control total asupra codului tău de antrenament fără să te confrunți cu infernul infrastructurii:
• Primești rețete SFT personalizate
• RL sau RLVR (Învățare prin întărire cu recompense verificabile)
• Poți folosi propriile funcții de recompensă
• Poți folosi propriile buclele de antrenament
Ei se ocupă de tot ce ține de infrastructură:
• Nu atingi niciodată configurațiile Kubernetes
• Niciodată nu atingi planificatoarele cluster
• Niciodată nu atingi provisioning-ul GPU
• Nu atingi niciodată instalația sanitară distribuită la puncte de control
Acest lucru deschide perfecționarea pentru mult mai multe echipe.
Nu mai trebuie să alegi între "prea simplu ca să fie util" și "atât de complex încât e un coșmar".
Ideea cheie aici este foarte simplă: acest model decuplează proiectarea algoritmilor de ingineria infrastructurii.
Mai este ceva:
Cu acest model, plătești pe token în loc să închiriezi GPU-uri pe oră și să te ocupi de clustere inactive.
Dacă vrei să încerci asta, te poți înscrie cu un cod pe care echipa mi-l a oferit (încorporat în linkul de mai jos):
Acest cod îți va oferi 10 dolari în vouchere gratuite (aproximativ 1,5 milioane de jetoane) pentru a-ți desfășura primul job de instruire.
Iar aici este Depozitul GitHub cu SDK-ul:
Mulțumiri echipei HPC-AI pentru colaborarea cu mine la această postare.
438
Limită superioară
Clasament
Favorite
