Napsal jsem blogový příspěvek o tom, jak jsme vytvořili samotestovací subagent založený na REPL, který přechází z 20 minut na > 200 minut autonomního běhu v Agentu 3 :) hlavní věc, kterou jsme chtěli vyřešit, byl problém LLM generujících aplikace, které vypadaly, že fungují, ale ve skutečnosti jsou jen high-fidelity mocky
Replit se zabývá tvorbou funkčních aplikací a ukazuje se, že dát agentovi možnost sebeověřování je jedním z klíčových nástrojů k větší autonomii agentů
Vytvořením rozhraní podobného notebooku pro agenta jsme zjistili, že to odemklo velmi lidsky podobný iterativní režim testování, který byl flexibilní a nákladově škálovatelný pro nasazení v produkci
101