Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tinker od Thinking Machines, będący w GA, to jedno z pierwszych uruchomień od dłuższego czasu, które naprawdę wydaje się być treningiem jako produktem.
Większość hostowanych API do fine-tuningu (w tym OpenAI) jest świetna, gdy potrzebujesz tylko czystego uruchomienia SFT, ale w momencie, gdy chcesz zrobić cokolwiek nawet nieco bardziej skomplikowanego: niestandardowe programy nauczania, oceny online, nagradzanie po treningu, pętle przypominające RL, dziwne sztuczki z pakowaniem: szybko uderzasz w sufit i kończysz na odbudowywaniu połowy stosu treningowego.
Tinker zasadniczo to zmienia: daje ci API do treningu z niskopoziomowymi prymitywami (sample / forward_backward / optim_step / save_state), więc piszesz pętlę, której naprawdę chcesz, a oni zajmują się częściami, które normalnie zamieniają się w miesiąc pracy infrastrukturalnej (harmonogramowanie, skalowanie, preempcje, odzyskiwanie po awarii, dlaczego ta praca zakończyła się na 93% itp.).
Jest też pierwszym rozwiązaniem LoRA, co jest dokładnie właściwym domyślnym ustawieniem dla dostosowywania: iterujesz szybciej, koszty pozostają rozsądne, możesz trzymać wiele wariantów bez duplikowania ogromnych punktów kontrolnych, a serwowanie staje się znacznie bardziej praktyczne. Podoba mi się również, że historia nie jest mglista: LoRA naprawdę może dorównać pełnemu fine-tuningowi w wielu zbiorach danych po treningu, gdy jest odpowiednio skonfigurowana, ale jeśli próbujesz wcisnąć ogromną zmianę zachowania w mały adapter (lub twój zbiór danych po prostu przewyższa efektywną pojemność adaptera), poczujesz ten wąskie gardło i nie zniknie to magicznie.
Jedynym prawdziwym minusem, który widzę, jest minimalny model: jeśli twoim celem są małe SLM-y na krawędzi, to prawdopodobnie nie jest to narzędzie. Mimo to, jestem podekscytowany. Nie mogę się doczekać, co ludzie zbudują.
Najlepsze
Ranking
Ulubione
