Hvis du ikke kan se hva en agent gjør, kan du ikke forbedre det, du kan ikke feilsøke det, og du kan ikke stole på det. Det er utrolig hvor mange team som bygger agenter uten noen måte å forstå hva de driver med. Bokstavelig talt NULL observabilitet. Dette er sannsynligvis et av de første spørsmålene jeg stiller hvert nytt team jeg møter: Kan du vise meg sporene etter noen henrettelser av dine agenter? Nada. Null. Nilch. Store språkmodeller tar dårlige beslutninger hele tiden. Agenter feiler, og du vil ikke innse det før noen klager. Minst bør hver agent du bygger produsere spor som viser hele forespørselsflyten, latensanalyse og systemnivå-ytelsesmålinger. Dette alene vil avdekke 80 % av de operative problemene. Men ideelt sett kan du gjøre noe mye bedre og fange opp alt dette: • Modellinteraksjoner • Bruk av token • Metadata om timing og ytelse • Hendelsesutførelse Hvis du vil ha pålitelige agenter, er ikke observabilitet valgfritt.