Я щойно написав блог про те, як ми створили першу версію Grail (grail-v0) — повністю відкриту, децентралізовану систему навчання RL для LLM. Один із перших своїх видів. Все публічно: кодова база, навчальний цикл, криві живого навчання, стимули, запуски. 🧵 1/4