Se non puoi vedere cosa fa un agente, non puoi migliorarlo, non puoi debuggare e non puoi fidarti di esso. È pazzesco quante squadre stiano costruendo agenti senza alcun modo per capire cosa stiano facendo. Letteralmente ZERO osservabilità. Questa è probabilmente una delle prime domande che faccio a ogni nuova squadra che incontro: Puoi mostrarmi le tracce di alcune esecuzioni dei tuoi agenti? Nada. Zero. Nilch. I modelli di linguaggio di grandi dimensioni prendono decisioni sbagliate tutto il tempo. Gli agenti falliscono, e non te ne accorgerai finché qualcuno non si lamenta. Al minimo, ogni agente che costruisci dovrebbe produrre tracce che mostrano il flusso completo della richiesta, l'analisi della latenza e le metriche di prestazione a livello di sistema. Questo da solo farà emergere l'80% dei problemi operativi. Ma idealmente, puoi fare qualcosa di molto meglio e catturare tutto il seguente: • Interazioni del modello • Utilizzo dei token • Metadati di temporizzazione e prestazioni • Esecuzione degli eventi Se vuoi agenti affidabili, l'osservabilità non è facoltativa.