Du kan bare gjøre ting i prime-rl – som å lære GLM5 å svare på matematikk i <2000-tokens med 16 noder for trening og 12 noder for å gjøre inferens, med 2P4D-konfigurasjon kun UV kjør rl @ rl.toml (@samsja19 sa jeg burde tweete mer)