Я только что написал блог о том, как мы создали первую версию grail (grail-v0), полностью открытую, децентрализованную систему обучения RL для LLM. Один из первых в своем роде. Все открыто: кодовая база, цикл обучения, живые кривые обучения, стимулы, развертывания. 🧵 1/4