J'ai créé ma première "compétence". Codex extrait les journaux d'erreurs récents de la production où l'agent a effectué des appels d'outils qui ont échoué. Les journaux incluent suffisamment d'état pour que Codex puisse : - classer chaque cas - reproduire localement - déboguer et corriger, si c'est un bug produit il a corrigé certains bugs obscurs
parfois, les erreurs ne sont que des LLM qui font les fous, comme appeler mon outil "remplacer" avec des chaînes identiques pour la correspondance et le remplacement. mais souvent, c'est un bug dans mes trucs. Je peux simplement exécuter "$tool-failure-triage" dans Codex quand je veux. c'est tellement génial.
quand je le fais, on dirait vraiment un employé
20 minutes de travail, c'est tellement incroyable
54