Jeg lagde min første "ferdighet". Codex henter nylige feillogger fra produksjonen der agenten gjorde verktøykall som feilet. loggene inkluderer nok tilstand til at Codex kan: - klassifisere hvert tilfelle - reprodusere lokalt - feilsøke og fikse, hvis produktfeil oppstår Den har fikset noen obskure feil
Noen ganger er feilene bare LLM-er som er tullete, som å kalle mitt "erstatte"-verktøy med identiske strenger for matching og erstatning. Men ofte er det en feil i tingene mine. Jeg kan bare kjøre "$tool-failure-triage" i Codex når jeg vil. Det er så fantastisk.
Når jeg får den til å gjøre dette, føles det virkelig som en ansatt
20 minutter med arbeid, så jævlig fantastisk
52