文脈が多ければより良いエージェントがいるわけではありません。 現在のエージェント記憶の方法はトランスクリプトリプレイで、過去のすべてのやり取りをプロンプトに付け加える方法です。もっと歴史があり、より多くの情報があり、より良い判断が欲しかった。 代替案は検索ベースのメモリで、過去のやり取りを外部に保存し、関連するアーティファクトをターンごとに取得します。 ある程度は効果的ですが、どちらのアプローチも相互作用が長引くにつれて失敗します。 トランスクリプトの再生は、無制限の文脈拡大を引き起こし、注意選択性を低下させ、繰り返される再露出によって初期の誤りを持続させます。 検索は意味的な類似性を最適化し、決定の関連性を重視せず、選択誤差はターンごとに重なり合います。 本論文では、エージェント認知コンプレッサー(ACC)を導入します。これは生体模倣された記憶制御装置で、トランスクリプトの再生を各ターンごとにオンラインで更新される有界の内部状態に置き換えます。 エージェントに必要なのは、より多くの文脈ではなく、より良い記憶管理です。 ACCは圧縮認知状態(CCS)を維持しており、これは意思決定に関わる重要な変数(目標、制約、エンティティ、関係、不確実性シグナル)のみを含むスキーマ支配の表現です。 各ターンで、ACCは候補アーティファクトをリコールし、予備ゲートを通してフィルタリングし、次の状態に移行するもののみをコミットします。 重要なのは、ACCが遺物のリコールと州の義務を分離していることです。回収されたコンテンツは、スキーマ制約による圧縮を通じてのみ次の状態に影響を与えることができます。これにより、未検証のコンテンツが永続的な記憶になるのを防ぎます。 IT運用、サイバーセキュリティ対応、医療ワークフローにまたがる600回のライブ評価(3万ターン)を通じて、ACCは有界メモリを維持しつつ、トランスクリプトの再生は線形的に増加しました。ACCは50ターンエピソードでほぼゼロの幻覚とドリフト率を記録した一方、ベースラインおよび回収エージェントはストレスターン後の故障が増加しました。 回収エージェントは、ドリフトのエスカレーションを防ぐために、1ターンあたり3つのアーティファクトに制限する必要がありました。それでも選択ミスは不安定さを引き起こしました。 マルチターンエージェントの失敗は、知識の欠落よりも記憶制御の弱さによって引き起こされます。認知圧縮は、信頼できる長期エージェントの実践的な基盤を提供します。 論文: ...