Folk frågar hela tiden hur jag hanterar kodagenter. Här är det faktiska systemet. Kärninsikten: en lång AI-kodningssession är skör. Den samlar på sig kontext, hallucinerar, stannar upp. Så istället för ett maraton springer jag många sprintar. Varje agentsession börjar om från början och tar vid där den förra slutade via git-historik och filstatus. Detta kallas en "Ralph-loop." Ett wrapper-skript startar upprepade gånger en kodningsagent med samma prompt tills arbetet är klart. Om den stannar eller kraschar – inga problem. Nästa version börjar rent utan något bagage. Jag använder Opus 4.6 för planeringen — skriver PRD:er, bryter ner arkitektur, definierar uppgiftsspecifikationer. Sedan hanterar Codex 5.3 själva kodningsexekveringen. Vi har funnit att denna uppdelning ger den mest pålitliga, högkvalitativa koden med minst buggfixar eller uppföljningsfel. Jag skriver en PRD som en checklista för nedskrivning. Loopen validerar komplettering genom att kryssa i att alla rutor är kryssade i. Agenten påstår att det är klart men 12 av 47 uppgifter återstår? Startade om. Ingen förhandling med en förvirrad modell. Agenterna kör tmux-sessioner så att de överlever omstarter. Jag övervakar dem på ett ögonblick – om en dog startar jag om den automatiskt. Om en stannar (samma resultat för två på varandra följande kontroller), döda och starta om. Varje tmux-session inkluderar en wake hook i slutet: när agenten är klar utlöser den en händelse som pingar mig direkt. Inga tysta avslutande. Jag vet när arbetet är klart, oavsett om jag övervakar eller inte. På en bra dag kör jag 3-4 agenter parallellt på separata projekt, var och en i sitt eget git-arbetsträd. Förra veckan körde jag 108 uppgifter över 3 projekt samtidigt på ungefär 4 timmar. Den andra nyckeln: testdrivna prompts. Jag säger åt agenten att skriva underkända tester först och sedan implementera. Tester är deterministiska acceptanskriterier för en icke-deterministisk arbetare. Minskar dramatiskt misslyckanden efter sammanslagningen. Det är inte magi. Det är processteknik tillämpad på AI-arbete. Rensa specifikationerna, automatiserad validering, starta om när du fastnar, verifiera resultatet. Det här är en av de vanligaste frågorna jag får, så jag tänker skriva ner detta ordentligt och lägga till det som ett nytt kapitel i Hur man anlitar en AI. Alla som redan köpt får den uppdaterade versionen.