Запустив повністю асинхронний тренажер на @grail_ai mainnet, тренуючи модель 🚀 7B Тренування тепер відбувається безперервно з буфера повторів! Ніякого очікування на зв'язок. Це розблокувало контекст 2k+ і дозволило масштабуватися від моделей 1.5B → 7B, а згодом і ще більшого.