Ho creato la mia prima "abilità". Codex estrae i log degli errori recenti dalla produzione dove l'agente ha effettuato chiamate a strumenti che sono fallite. I log includono uno stato sufficiente per Codex per: - classificare ogni caso - riprodurre localmente - fare debug e correggere, se si tratta di un bug del prodotto ha risolto alcuni bug oscuri.
a volte gli errori sono solo LLM che si comportano in modo sciocco, come chiamare il mio strumento "replace" con stringhe identiche per la corrispondenza e la sostituzione. ma spesso, è un bug nel mio codice. Posso semplicemente eseguire "$tool-failure-triage" in Codex ogni volta che voglio. è fantastico.
quando lo faccio, sembra davvero un dipendente
20 minuti di lavoro, così incredibilmente fantastico
41