Новое исследование по улучшению саморефлексии в языковых агентах. Основная проблема с саморефлексией агентов заключается в том, что модели, как правило, генерируют повторяющиеся размышления, которые добавляют шум вместо сигнала, что ухудшает общую производительность рассуждений. Вводится ParamMem, параметрический модуль памяти, который кодирует паттерны размышлений между образцами непосредственно в параметры модели, а затем использует выборку с контролем температуры для генерации разнообразных размышлений во время вывода. ParamMem демонстрирует постоянные улучшения по сравнению с SOTA-базовыми моделями в области генерации кода, математического рассуждения и многопроходного QA. Он также позволяет осуществлять слабую к сильной передачу и самоулучшение без необходимости в более сильной внешней модели, что делает его практическим обновлением для агентских пайплайнов. Статья: Научитесь создавать эффективные AI-агенты в нашей академии: