Om du redan bor inne i Claude Code kan du det uppenbara (terminal-native, tight loop, se det köras, grepploggar, patcha, köra om, commita). Så här är den mer intressanta frågan: varför känns Codex som att den kommer ikapp utan att bara klona den interaktiva terminalagent-känslan? Codex är delegeringsförst, inte parprogrammeringsförst. Claude Codes superkraft är den tajta interaktiva kontrollloopen: Du och agenten delar en enda cockpit. Det är sevärt. Du ingriper mitt i flygningen. Du styr innan den bränner tiden ner på en dålig väg. Det är i princip agent som en förlängning av ditt skal. Codex satsning är annorlunda: agent som parallell kollega som arbetar vid sin egen dator Den inramningen innebär en mängd produktkonsekvenser som är lätta att missa om man bara jämför modellresultat: 1) Asynkroni som funktion (inte en bieffekt) Codex är designad för att du ska kunna lämna över en uppgift, göra något annat och sedan återvända till en repetitionsbar artefakt Tyngdpunkten blir PR/differential. Det är därför man ser språk som "delegera", "överflödsmentalitet", "köa upp en massa uppgifter". Arbetsflödet är: spawna N jobb, sedan granska/slå ihop. 2) Isolering och sandboxing är inte bara infrastruktur, det är UX. Varje uppgift som körs i sin egen isolerade miljö ändrar förtroendemodellen: Agenten kan köra tester, ändra filer, generera commits utan att kontaminera din lokala arbetsyta. Du får säkerhetsgränser (och ofta konservativa standarder) som gör det lättare att låta det bara göra som det är. 3) Sammanslagning är det faktiska målmåttet. Claude Code känns fantastisk eftersom loopen konvergerar. Medan Codex explicit optimerar för att komma tillbaka med något du kan slå ihop. Så jämförelsens form blir tydligare: Claude Code = bäst när uppgiften kräver bedömningar mitt i strömmen, snabba avbrott och mänsklig styrning. Det är "den trånga cockpitloopen". Codex = bäst när uppgiften kan delegeras, parallelliseras och returneras som sammanfogningsbara artefakter. Det är "kollega med eget arbetsutrymme". ...