Uruchomiono w pełni asynchronicznego trenera na głównym łańcuchu @grail_ai, trenując model 7B 🚀 Trening teraz odbywa się ciągle z bufora odtwarzania! Nie ma czekania na komunikację. To odblokowało 2k+ kontekst i pozwoliło nam skalować z modeli 1.5B → 7B, a nawet większych w przyszłości.