Jika Anda tidak dapat melihat apa yang dilakukan agen, Anda tidak dapat meningkatkannya, Anda tidak dapat men-debugnya, dan Anda tidak dapat mempercayainya. Sungguh gila berapa banyak tim yang membangun agen tanpa cara untuk memahami apa yang mereka lakukan. Secara harfiah ZERO observabilitas. Ini mungkin salah satu pertanyaan pertama yang saya ajukan kepada setiap tim baru yang saya temui: Bisakah Anda menunjukkan kepada saya jejak beberapa eksekusi agen Anda? Nada. Nol. Nilch. Model bahasa besar membuat keputusan yang buruk sepanjang waktu. Agen gagal, dan Anda tidak akan menyadarinya sampai seseorang mengeluh. Minimal, setiap agen yang Anda buat harus menghasilkan pelacakan yang menunjukkan alur permintaan penuh, analisis latensi, dan metrik performa tingkat sistem. Ini saja akan memunculkan 80% masalah operasional. Tetapi idealnya, Anda dapat melakukan sesuatu yang jauh lebih baik dan menangkap semua hal berikut: • Model interaksi • Penggunaan token • Metadata waktu dan kinerja • Eksekusi acara Jika Anda menginginkan agen yang andal, Observabilitas tidak opsional.