Kirjoitin juuri blogin siitä, miten loimme Grailin ensimmäisen version (grail-v0), täysin avoimen, hajautetun RL-koulutusjärjestelmän LLM:ille. Yksi sen ensimmäisistä. Kaikki on julkista: koodipohja, koulutussilmukka, reaaliaikaiset koulutuskäyrät, kannustimet, julkaisut. 🧵 1/4