Meluncurkan pelatih sepenuhnya asinkron di mainnet @grail_ai, melatih model 🚀 7B Pelatihan sekarang berjalan terus menerus dari buffer replay! Tidak menunggu komunikasi. Ini membuka konteks 2k+ dan memungkinkan kita menskalakan dari model 1.5B → 7B dan bahkan lebih besar nanti.