Vårt team i FAIR hos Meta ansetter en postdoktor! Vi jobber med temaene resonnement, justering og minne/arkitekturer (RAM). Søk her: Sted: NY, Seattle eller Menlo Park. Noe av vårt nylige arbeid for å gi smak: Samforbedring (stilling): SPICE (Selvspill i korpusmiljøer): Selvutfordrende agenter: RL fra menneskelig interaksjon: AggLM (parallell aggregering): StepWiser (CoT-PRM RL): DARLING (mangfoldstrent RL): J1 (RL-utdannet LLM som dommer): CoT-Selvinstruer: Multi-token oppmerksomhet: