A nossa equipa na FAIR da Meta está a recrutar um investigador pós-doutorado! Trabalhamos nos tópicos de Raciocínio, Alinhamento e Memória/arquiteturas (RAM). Candidate-se aqui: Localização: NY, Seattle ou Menlo Park. Alguns dos nossos trabalhos recentes para dar uma ideia: Co-Improvement (posição): SPICE (Auto-Jogo em Ambientes de Corpus): Agentes Auto-Desafiantes: RL a partir da Interação Humana: AggLM (agregação paralela): StepWiser (CoT-PRM RL): DARLING (RL treinado para diversidade): J1 (RL treinado LLM-como-Juiz): CoT-Self-Instruct: Multi-Token Attention: