¡Nuestro equipo en FAIR de Meta está contratando a un investigador postdoctoral! Trabajamos en los temas de Razonamiento, Alineación y Memoria/arquitecturas (RAM). Aplica aquí: Ubicación: NY, Seattle o Menlo Park. Algunos de nuestros trabajos recientes para dar una idea: Co-Mejora (posición): SPICE (Auto-Juego en Entornos de Corpus): Agentes Auto-Retadores: RL a partir de la Interacción Humana: AggLM (agregación paralela): StepWiser (CoT-PRM RL): DARLING (RL entrenado en diversidad): J1 (RL entrenado LLM-como-Juez): CoT-Self-Instruct: Atención Multi-Token: