Наша команда в FAIR в Meta ищет постдока-исследователя! Мы работаем над темами Рассуждения, Согласования и Памяти/архитектур (RAM). Подайте заявку здесь: Местоположение: Нью-Йорк, Сиэтл или Менло-Парк. Некоторые из наших недавних работ для примера: Совместное улучшение (позиция): SPICE (Самоигра в Корпусных Средах): Само-вызов агентов: RL из взаимодействия с человеком: AggLM (параллельная агрегация): StepWiser (CoT-PRM RL): DARLING (обучение разнообразию RL): J1 (RL-обученная LLM как Судья): CoT-Self-Instruct: Много-токенное внимание: