Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Наша команда в FAIR в Meta ищет постдока-исследователя!
Мы работаем над темами Рассуждения, Согласования и Памяти/архитектур (RAM).
Подайте заявку здесь:
Местоположение: Нью-Йорк, Сиэтл или Менло-Парк.
Некоторые из наших недавних работ для примера:
Совместное улучшение (позиция):
SPICE (Самоигра в Корпусных Средах):
Само-вызов агентов:
RL из взаимодействия с человеком:
AggLM (параллельная агрегация):
StepWiser (CoT-PRM RL):
DARLING (обучение разнообразию RL):
J1 (RL-обученная LLM как Судья):
CoT-Self-Instruct:
Много-токенное внимание:
Топ
Рейтинг
Избранное
