もしすでにClaude Codeの中に住んでいるなら、明らかなことは知っているでしょう(ターミナルネイティブ、タイトループ、実行監視、grepログ、パッチ、再実行、コミット)。では、より興味深い質問です: なぜCodexはインタラクティブなターミナルエージェントの雰囲気を単にコピーするのに追いついているように感じるのでしょうか? Codexはペアプログラミングではなく委任優先です。 Claude Codeの強みは、緻密なインタラクティブな操作ループにあります: あなたとエージェントは一つのコックピットを共有しています。観る価値はあります。飛行中に介入する。時間が悪い道に向かう前に舵を取る。基本的にはあなたのシェルの延長線上にあるエージェントのようなものです。 Codexの賭けは違います。エージェントは別のコンピューターで並行して働く同僚です この枠組みは、モデルの出力だけを比較すると見落としやすい多くの製品結果を示唆しています。 1) 非同期性を特徴として(副産物ではない) Codexはタスクを任せて別のことをし、戻ってきて確認可能なアーティファクトを見つけるために設計されています 重心はPRやディファルとなります。だからこそ「委任する」「豊かさの考え方」「タスクをたくさんの順番に進める」といった言葉がよく使われるのです。ワークフローはこうです:N個のジョブをスポーンし、その後レビュー・マージします。 2) 隔離やサンドボックスは単なるインフラではなく、UXです。 それぞれのタスクが独立した環境で動作すると信頼モデルが変わります。エージェントはテストを実行し、ファイルを変更し、コミットを生成してもローカルワークスペースを汚染しません。安全境界(そして多くの場合は保守的なデフォルト)ができ、そのままやらせやすくなります。 3) マージ可能性が実際の目標指標です。クロードコードはループが収束するので素晴らしい感触です。一方でCodexは、マージ可能なものを明示的に最適化しています。 こうして比較の形がより明確になります。 Claude Code = タスクが途中で判断を下し、高速割り込み、人間の操作を必要とする場合に最適です。それが「タイトなコックピットループ」です。 Codex = タスクを委任し、並列化し、マージ可能なアーティファクトとして返すことができる場合に最適です。「同僚が専用の作業スペースを持つ」という意味です。 ...