يمكن لوكلاء البرمجيات تحسين أنفسهم عبر التعلم المعزز الذاتي نقدم لكم SWE-RL الذاتي (SSR): تدريب وكيل واحد من نموذج اللغة اللغوية على اللعب الذاتي بين حقن الأخطاء وإصلاحها، متجذرة في مستودعات العالم الحقيقي، دون مشاكل أو اختبارات مصنفة من قبل البشر. 🧵