Vårt team på FAIR på Meta anställer en postdoktor forskare! Vi arbetar med ämnena resonemang, justering och minne/arkitekturer (RAM). Ansök här: Plats: NY, Seattle eller Menlo Park. Några av våra senaste arbeten för att ge smak: Medförbättring (position): SPICE (Självspel i corpus-miljöer): Självutmanande agenter: RL från Human Interaction: AggLM (parallell aggregering): StepWiser (CoT-PRM RL): DARLING (mångfaldstränad RL): J1 (RL-utbildad LLM som domare): CoT-Självinstruerar: Multi-token-uppmärksamhet: