Dostal jsem svou multiagentní hru z 83 % úspěšných exekucí na něco málo přes 92 %. Obrovské zlepšení! Zde je nejdůležitější lekce, kterou jsem se naučil: Přesunout co nejvíce funkcionality do nástrojů a nechat je používat LLM. Čím méně toho LLM musí udělat, tím lépe. LLM je mnohem lepší v rozhodování, který nástroj použít, než dělat práci s tímto nástrojem sám, i když je to jednoduchá práce. Zredukoval jsem 100řádkovou výzvu na 25 řádků a 3 funkce Pythonu, které implementují všechny funkce. Nevýhodou je více kódu, ale výhodou je, že spolehlivost vzrostla téměř o 10 %.