Notre équipe à FAIR chez Meta recrute un chercheur postdoctoral ! Nous travaillons sur les sujets de Raisonnement, Alignement et Mémoire/architectures (RAM). Postulez ici : Lieu : NY, Seattle ou Menlo Park. Voici quelques-uns de nos travaux récents pour donner une idée : Co-Amélioration (position) : SPICE (Auto-Jouer dans des Environnements de Corpus) : Agents Auto-Défiants : RL à partir de l'Interaction Humaine : AggLM (agrégation parallèle) : StepWiser (CoT-PRM RL) : DARLING (RL entraîné à la diversité) : J1 (LLM entraîné par RL en tant qu'Arbitre) : CoT-Self-Instruct : Attention Multi-Token :