Acabo de escribir un blog sobre cómo creamos la primera versión de Grail (Grail-v0), un sistema de entrenamiento RL totalmente abierto y descentralizado para LLMs. Uno de sus primeros tipos. Todo es público: la base de código, el bucle de entrenamiento, las curvas de entrenamiento en vivo, los incentivos, los despliegues. 🧵 1/4