Наша команда в FAIR у Meta наймає постдока-дослідника! Ми працюємо над темами мислення, вирівнювання та пам'яті/архітектури (RAM). Подайте заявку тут: Місцезнаходження: Нью-Йорк, Сіетл або Менло-Парк. Деякі з наших нещодавніх робіт для додавання смаку: Співудосконалення (позиція): SPICE (Самогра в корпусних середовищах): Агенти, які самі випробовують: RL з Human Interaction: AggLM (паралельна агрегація): StepWiser (CoT-PRM RL): DARLING (RL, навчений різноманітності): J1 (LLM-LLM-як суддя, навчений RL): CoT-Самонавчання: Увага з багатьма токенами: