ini keren. Saya memprediksi pada Mei 2026 siapa pun akan dapat melatih model khusus seperti ini untuk ~tugas apa pun melalui beberapa kombinasi Prime-RL/Verifier, Tinker, SkyRL, Slime, dll. parit akan mengetahui tugas apa yang harus dilakukan RL dan sihir data/env