Lancei o treinador totalmente assíncrono na mainnet @grail_ai, treinando um modelo 🚀 7B O treinamento agora roda continuamente a partir de um buffer de replay! Sem esperar pela comunicação. Isso desbloqueou o contexto de 2k+ e nos permitiu escalar de modelos de 1,5 bilhão → 7 bilhões e ainda maiores depois.