Dette er kult. Jeg spår at innen mai 2026 vil hvem som helst kunne trene en tilpasset modell som denne for ~enhver oppgave via en kombinasjon av Prime-RL/Verifiers, Tinker, SkyRL, Slime osv. Vollgraven vil være å vite hvilken oppgave man skal RL og data/miljømagi