Jeden z prvních agentů, které jsem vytvořil, byl extrémně jednoduchý: Získával informace z vektorového úložiště, formátoval je jako HTML a zasílal je uživateli e-mailem. Jednodušší to už být nemůže, a přesto tento agent selhal asi v 1 % případů. Žádná chyba. Žádné varování. Jen to vrátilo odpadky. Tady je tvrdá pravda: Agenti často selhávají. A tiše selhávají. Neustále. Nemůžete LLM věřit, že udělá správnou věc pokaždé. Do té doby jsem vybudoval a nasadil několik desítek agentů a tady jsou některé věci, které skutečně fungují: 1. Pozorovatelnost od prvního dne. Pokud nevidíte, co váš agent dělá, nemůžete to ladit, vylepšovat ani mu důvěřovat. Každý agent by měl vytvářet stopy ukazující celý tok požadavků, interakce modelů, využití tokenů a metadata načasování. 2. Zábrany na vstupech a výstupech. Vše, co vstupuje do LLM a z něj vychází, by mělo být kontrolováno deterministickým kódem. I věci, které se pravděpodobně nerozbijí, se nakonec rozbijí. 3. Hodnocení LLM jako soudce. Můžete si vytvořit jednoduchého soudce pomocí LLM, který automaticky vyhodnocuje výstupy vašeho agenta. Označte datovou sadu, napište hodnotící prompt a iterujte, dokud váš rozhodčí neodhalí většinu chyb. 4. Analýza chyb. Můžete sbírat vzorky selhání, kategorizovat je a diagnostikovat nejčastější chyby. 5. Kontextové inženýrství. Často agenti selžou, protože jejich kontext je hlučný, přetížený nebo irelevantní. Naučit se udržet kontext relevantní je obrovské. 6. Lidské zpětné vazby. Někdy je nejlepší zábranou člověk v procesu, zvlášť u rozhodnutí s vysokými sázkami.