Mjukvaruagenter kan förbättra sig själva genom självspel i verkligheten Vi introducerar Self-play SWE-RL (SSR): att träna en enda LLM-agent att självspela mellan bug-injektion och bugg-reparation, förankrad i verkliga arkiv, utan mänskligt märkta problem eller tester. 🧵