Le persone continuano a chiedere come gestisco gli agenti di codifica. Ecco il sistema reale. L'intuizione principale: una lunga sessione di codifica AI è fragile. Accumula contesto, allucina, si ferma. Quindi, invece di una maratona, eseguo molti sprint. Ogni sessione dell'agente inizia fresca e riprende da dove l'ultima si era fermata tramite la cronologia git e lo stato dei file. Questo è chiamato un "Ralph loop." Uno script wrapper avvia ripetutamente un agente di codifica con lo stesso prompt fino al completamento del lavoro. Se si ferma o si blocca — nessun problema. La prossima iterazione inizia pulita senza alcun bagaglio. Utilizzo Opus 4.6 per la pianificazione — scrivendo PRD, scomponendo l'architettura, definendo le specifiche dei compiti. Poi Codex 5.3 gestisce l'esecuzione effettiva del codice. Abbiamo scoperto che questa divisione produce il codice più affidabile e di alta qualità con il minor numero di correzioni di bug o problemi di follow-up. Scrivo un PRD come una checklist in markdown. Il loop convalida il completamento controllando se tutte le caselle sono spuntate. L'agente afferma di aver finito ma rimangono 12/47 compiti? Riavviato. Niente trattative con un modello confuso. Gli agenti vengono eseguiti in sessioni tmux in modo che possano sopravvivere ai riavvii. Li monitoro su un heartbeat — se uno muore, lo riavvio automaticamente. Se uno si blocca (stessa uscita per due controlli consecutivi), uccido e riavvio. Ogni sessione tmux include un wake hook alla fine: quando l'agente finisce, genera un evento che mi avvisa immediatamente. Niente completamenti silenziosi. So nel momento in cui il lavoro è finito, che stia monitorando o meno. In una buona giornata eseguirò 3-4 agenti in parallelo su progetti separati, ciascuno nel proprio worktree git. La settimana scorsa ho eseguito 108 compiti su 3 progetti simultaneamente in circa 4 ore. L'altro punto chiave: prompt guidati dai test. Dico all'agente di scrivere prima test che falliscono, poi implementare. I test sono criteri di accettazione deterministici per un lavoratore non deterministico. Riduce drasticamente i fallimenti post-fusione. Non è magia. È ingegneria dei processi applicata al lavoro AI. Specifiche chiare, convalida automatizzata, riavvio quando si è bloccati, verifica dell'output. Questa è una delle domande più comuni che ricevo, quindi scriverò questo in modo appropriato e lo aggiungerò come nuovo capitolo a Come assumere un AI. Tutti coloro che hanno già acquistato riceveranno la versione aggiornata.