Saya membuat "keterampilan" pertama saya. Codex menarik log kesalahan terbaru dari prod tempat agen melakukan panggilan alat yang gagal. log menyertakan status yang cukup untuk Codex untuk: - mengklasifikasikan setiap kasus - bereproduksi secara lokal - debug & fix, jika bug produk itu telah memperbaiki beberapa bug yang tidak jelas
terkadang kesalahannya hanya LLM yang konyol, seperti memanggil alat "pengganti" saya dengan string yang identik untuk pencocokan dan penggantian. Tapi seringkali, itu adalah bug dalam barang-barang saya. Saya bisa menjalankan "$tool-failure-triage" di Codex kapan pun saya mau. Ini sangat mengagumkan.
ketika saya melakukannya melakukan ini, rasanya benar-benar seperti seorang karyawan
20 menit bekerja, sangat luar biasa
52