Jag skapade min första "färdighet". Codex hämtar senaste felloggar från produktionen där agenten gjorde verktygsanrop som misslyckades. loggar innehåller tillräckligt med tillstånd för att Codex ska kunna: - klassificera varje fall - reproducera lokalt - felsökning och fix, om produktbugg Den har fixat några obskyra buggar
ibland är felen bara LLM:er som är löjliga, som att kalla mitt "ersättningsverktyg" med identiska strängar för matchning och ersättning. Men ofta är det en bugg i mina saker. Jag kan bara köra "$tool-failure-triage" i Codex när jag vill. Det är så fantastiskt.
när jag låter den göra så känns det verkligen som en anställd
20 minuters arbete, så jävla fantastiskt
59