بنيت مهارة كود كلود تقوم بتدريب التعلم المعزز @PrimeIntellect من البداية إلى النهاية تعطيه اسم مجموعة بيانات. يتعامل مع كل شيء — وظيفة المكافأة، التحقق، التقييم، دفع المركز، تقديم التدريب مهمة واحدة - > التشغيل. "ابن بيئة للجبر المجرد في cais/mmlu، استخدم Qwen/Qwen3-30B-Instruct-2507، 1000 خطوة، وقدم مهمة التدريب." الرابط في التعليقات