Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Наша команда в FAIR у Meta наймає постдока-дослідника!
Ми працюємо над темами мислення, вирівнювання та пам'яті/архітектури (RAM).
Подайте заявку тут:
Місцезнаходження: Нью-Йорк, Сіетл або Менло-Парк.
Деякі з наших нещодавніх робіт для додавання смаку:
Співудосконалення (позиція):
SPICE (Самогра в корпусних середовищах):
Агенти, які самі випробовують:
RL з Human Interaction:
AggLM (паралельна агрегація):
StepWiser (CoT-PRM RL):
DARLING (RL, навчений різноманітності):
J1 (LLM-LLM-як суддя, навчений RL):
CoT-Самонавчання:
Увага з багатьма токенами:
Найкращі
Рейтинг
Вибране
