Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
📈 сейчас в тренде на alphaXiv
"SkillRL: Эволюция агентов через рекурсивное обучение с подкреплением, дополненное навыками"
SkillRL превращает неупорядоченные траектории проб и ошибок агента LLM в компактную и поисковую библиотеку навыков, которая рекурсивно растет во время RL
Это позволяет агенту действительно учиться использовать повторяемые стратегии со временем, а не просто воспроизводить сырые воспоминания, что приводит к значительным улучшениям (+15,3% по сравнению с сильными базовыми моделями) при гораздо меньшем количестве токенов!

Топ
Рейтинг
Избранное
