Больше контекста не означает лучших агентов. Текущий подход к памяти агентов — это воспроизведение транскриптов, где вы добавляете каждое прошлое взаимодействие к подсказке. Больше истории, больше информации, лучшие решения. Альтернатива — это память на основе извлечения, где вы храните прошлые взаимодействия внешне и извлекаете соответствующие артефакты на каждом шаге. Хотя это эффективно в некоторой степени, оба подхода терпят неудачу по мере увеличения количества взаимодействий. Воспроизведение транскриптов вызывает неограниченный рост контекста, снижает селективность внимания и позволяет ранним ошибкам сохраняться через повторное воздействие. Извлечение оптимизирует семантическое сходство, а не релевантность решений, и ошибки выбора накапливаются на протяжении взаимодействий. Эта новая статья представляет Агентский Когнитивный Компрессор (ACC), вдохновленный биологией контроллер памяти, который заменяет воспроизведение транскриптов на ограниченное внутреннее состояние, обновляемое онлайн на каждом шаге. Агентам нужно не больше контекста, а лучший контроль памяти. ACC поддерживает Сжатое Когнитивное Состояние (CCS), представление, управляемое схемой, содержащее только критически важные для решения переменные: цели, ограничения, сущности, отношения и сигналы неопределенности. На каждом шаге ACC вспоминает кандидатные артефакты, фильтрует их через квалификационные ворота и фиксирует только то, что проходит в следующее состояние. Критически важно, что ACC отделяет вспоминание артефактов от обязательств по состоянию. Извлеченное содержимое может влиять на следующее состояние только через сжатие, ограниченное схемой. Это предотвращает превращение непроверенного содержимого в постоянную память. В ходе 600 живых оценок (30,000 шагов), охватывающих ИТ-операции, реагирование на киберугрозы и рабочие процессы в здравоохранении, ACC поддерживал ограниченную память, в то время как воспроизведение транскриптов росло линейно. ACC достиг почти нулевых показателей галлюцинаций и дрейфа на протяжении 50-шаговых эпизодов, в то время как базовые и извлекающие агенты показывали растущее количество сбоев после стрессовых шагов. Агент извлечения требовал ограничения вспоминания всего лишь до 3 артефактов на шаг, чтобы ограничить эскалацию дрейфа. Даже тогда ошибки выбора вызывали нестабильность. Сбои агентов в многоповоротных взаимодействиях вызваны не столько отсутствием знаний, сколько слабым контролем памяти. Когнитивное сжатие предоставляет практическую основу для надежных агентов с долгосрочной перспективой. Статья: ...