Interessant hoe niemand begrijpt dat de RL-pijplijn het moeilijkste onderdeel is van het bouwen van een state-of-the-art model tegenwoordig (tenzij het onder de 1T parameter grootte valt)