Acabei de escrever um blog sobre como criamos a primeira versão do Grail (Grail-v0), um sistema de treinamento de RL totalmente aberto e descentralizado para LLMs. Um dos seus primeiros tipos. Tudo é público: a base de código, o ciclo de treinamento, as curvas de treinamento ao vivo, os incentivos, os lançamentos. 🧵 1/4