Am lansat antrenorul complet asincron pe mainnet-@grail_ai, antrenând un model 🚀 7B Antrenamentul rulează acum continuu dintr-un buffer de reluare! Fără așteptări pentru comunicare. Aceasta a deblocat un context de 2k+ și ne-a permis să scalăm de la 1,5B → 7B modele și chiar mai mari ulterior.