Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Новое исследование по улучшению саморефлексии в языковых агентах.
Основная проблема с саморефлексией агентов заключается в том, что модели, как правило, генерируют повторяющиеся размышления, которые добавляют шум вместо сигнала, что ухудшает общую производительность рассуждений.
Вводится ParamMem, параметрический модуль памяти, который кодирует паттерны размышлений между образцами непосредственно в параметры модели, а затем использует выборку с контролем температуры для генерации разнообразных размышлений во время вывода.
ParamMem демонстрирует постоянные улучшения по сравнению с SOTA-базовыми моделями в области генерации кода, математического рассуждения и многопроходного QA. Он также позволяет осуществлять слабую к сильной передачу и самоулучшение без необходимости в более сильной внешней модели, что делает его практическим обновлением для агентских пайплайнов.
Статья:
Научитесь создавать эффективные AI-агенты в нашей академии:

Топ
Рейтинг
Избранное
