Právě jsem napsal blog o tom, jak jsme vytvořili první verzi Grailu (grail-v0), plně otevřený, decentralizovaný systém pro trénování RL pro LLM. Jeden z prvních druhů. Všechno je veřejné: kódová základna, tréninková smyčka, živé tréninkové křivky, pobídky, nasazení. 🧵 1/4