L'IA pour le raisonnement s'appuie souvent sur des vérificateurs — excellent pour les mathématiques, mais délicat pour l'écriture créative ou la recherche ouverte. Découvrez RARO : un nouveau paradigme qui enseigne aux LLM à raisonner via des jeux adversariaux au lieu de la vérification. Pas de vérificateurs. Pas d'environnements. Juste des démonstrations. 🧵👇