Se não consegues ver o que um agente faz, não consegues melhorá-lo, não consegues depurá-lo e não consegues confiar nele. É louco quantas equipas estão a construir agentes sem forma de entender o que estão a fazer. Literalmente ZERO observabilidade. Esta é provavelmente uma das primeiras perguntas que faço a cada nova equipa que conheço: Consegues mostrar-me os rastros de algumas execuções dos teus agentes? Nada. Zero. Nenhuns. Modelos de linguagem grandes tomam decisões erradas o tempo todo. Os agentes falham, e tu não perceberás isso até que alguém se queixe. No mínimo, cada agente que constróis deve produzir rastros mostrando o fluxo completo de pedidos, análise de latência e métricas de desempenho a nível de sistema. Isto por si só irá revelar 80% dos problemas operacionais. Mas idealmente, podes fazer algo muito melhor e capturar tudo o seguinte: • Interações do modelo • Uso de tokens • Metadados de tempo e desempenho • Execução de eventos Se queres agentes fiáveis, a observabilidade não é opcional.