Tim kami di FAIR di Meta mempekerjakan peneliti postdoc! Kami mengerjakan topik Penalaran, Penyelarasan dan Memori/arsitektur (RAM). Terapkan di sini: Lokasi: NY, Seattle atau Menlo Park. Beberapa pekerjaan terbaru kami untuk memberikan rasa: Peningkatan Bersama (posisi): SPICE (Bermain Sendiri di Lingkungan Korpus): Agen yang Menantang Diri Sendiri: RL dari Interaksi Manusia: AggLM (agregasi paralel): StepWiser (CoT-PRM RL): DARLING (RL terlatih keragaman): J1 (LLM-sebagai-Hakim terlatih RL): CoT-Instruksi Diri: Perhatian Multi-Token: