Mi-am făcut prima "abilitate". Codex extrage jurnalele recente de erori din producție unde agentul a făcut apeluri la unelte care au eșuat. jurnalele includ suficientă stare pentru ca Codex să: - clasificarea fiecărui caz - să se reproducă local - depanare & remediere, dacă este un bug de produs A rezolvat câteva bug-uri obscure
Uneori erorile sunt doar LLM-uri care sunt absurde, cum ar fi să chemi unealta mea de "înlocuire" cu șiruri identice pentru potrivire și înlocuire. Dar adesea, e un bug în lucrurile mele. Pot rula "$tool-failure-triage" în Codex oricând vreau. E atât de grozav.
când îl pun să facă asta, chiar se simte ca un angajat
20 de minute de muncă, atât de al naibii de uimitor
38