エージェントの操縦を改善する方法を偶然見つけました。具体的には、「必ずこれをやってくれ」と言ったのにLLMがそれをしなかった場合、どうやってパフォーマンスを向上させるかということです。 こちらがその内容です: 「Xを忘れずにやる」と言うのは信頼できません。LLMのエージェントが自発的に手続き的な動作を開始する必要があります。 しかし、特定の、場合によっては誤った主張(「あなたはXをすべきだ―まだやっているのか?」)を提示すると、誤った主張に対して確実に訂正行動が促されます。 エージェントは確認を忘れる必要はありません。提示された状態と実際の状態の不一致が、エージェントLLMが自然に反応する修正イベントを生み出します。 これは「インターネットで正解を得る最良の方法は間違った答えを投稿することだ」という古い格言を思い出させます。LLMは主にインターネットの「知識」を凝縮したものだから納得できます。 とにかく、私はエージェントのために長期間稼働するメモリシステムを構築しており、この方法で実装することで多くの問題が解決しました。