Zrobiłem mój pierwszy "skill". Codex pobiera ostatnie logi błędów z produkcji, gdzie agent wykonał wywołania narzędzi, które się nie powiodły. Logi zawierają wystarczający stan dla Codex, aby: - sklasyfikować każdy przypadek - odtworzyć lokalnie - debugować i naprawić, jeśli to błąd produktu naprawił kilka niejasnych błędów
czasami błędy to po prostu głupoty LLM-ów, jak nazywanie mojego narzędzia "replace" tymi samymi ciągami dla dopasowania i zamiany. ale często to błąd w moich rzeczach. Mogę po prostu uruchomić "$tool-failure-triage" w Codex, kiedy tylko chcę. to jest niesamowite.
kiedy to robię, naprawdę czuję się jak pracownik
20 minut pracy, takie zajebiste
41