Napisałem post na blogu o tym, jak zbudowaliśmy subagent samodzielnie testujący oparty na REPL, aby przejść z 20 minut -> 200 minut autonomicznego czasu pracy w Agencie 3 :) Główną rzeczą, którą chcieliśmy rozwiązać, był problem LLM-ów generujących aplikacje, które wyglądały na działające, ale w rzeczywistości były tylko wysokiej jakości makietami.
replit zajmuje się tworzeniem działających aplikacji, a okazuje się, że danie agentowi możliwości samodzielnej weryfikacji jest jednym z kluczowych elementów zwiększających autonomię agentów.
budując interfejs przypominający notatnik dla agenta, odkryliśmy, że odblokowało to bardzo ludzkopodobny iteracyjny tryb testowania, który był elastyczny i skalowalny kosztowo do wdrożenia w produkcji
110