هذا رائع. أتوقع أنه بحلول مايو 2026 سيتمكن أي شخص من تدريب نموذج مخصص كهذا ل ~أي مهمة عبر مزيج من Prime-RL/Verifiers، Tinker، SkyRL، Slime وغيرها. الخندق سيكون معرفة المهمة التي يجب أن تلعب بالحياة والبيانات والبيئة