MetaのFAIRチームがポスドク研究者を募集しています! 私たちは推論、アライメント、メモリ/アーキテクチャ(RAM)のテーマに取り組んでいます。 こちらから応募してください: 所在地:ニューヨーク州、シアトル、またはメンローパーク。 最近の作品の一部は、味わいを加えるために以下の通りです: 共育(ポジション): SPICE(コーパス環境でのセルフプレイ): 自己挑戦的なエージェント: 人間との交流からの現実学習: AggLM(並列集約: StepWiser(CoT-PRM RL): ダーリン(多様性訓練を受けたRL): J1(RLでLLMを審査員として訓練): CoT-自己指導: マルチトークンの注意: