Tam asenkron eğitmeni ana @grail_ai ağında başlattık, 7B modelini 🚀 eğittim Antrenman artık sürekli olarak tekrar oynatma tamponu üzerinden çalışıyor! İletişimi beklemek yok. Bu, 2k+ bağlamı açtı ve 1.5B→den 7B modellere ve ileride daha da büyük ölçeklenme imkanı verdi.