Prime-rl'de işleri yapabilirsiniz - mesela GLM5'e matematiği <2000 token'da cevaplamayı öğretmek için 16 düğüm ve 2P4D yapılandırmada 12 düğüm ile sadece uv çalıştırma ile rl @ rl.toml (@samsja19 daha fazla tweet atmamı söyledi)