escrevi um post no blog sobre como construímos um subagente de auto-teste baseado em REPL para passar de 20 min -> 200 min de tempo de execução autónomo no Agente 3 :) a principal coisa que queríamos resolver era o problema dos LLMs gerando apps que pareciam funcionar, mas que na verdade eram apenas simulações de alta fidelidade.
a replit está no negócio de criar aplicações funcionais e, ao que parece, dar ao agente meios para se auto-verificar é uma das chaves para uma maior autonomia nos agentes.
ao construir uma interface semelhante a um caderno para o agente, descobrimos que isso desbloqueou um modo de teste muito humano e iterativo que era flexível e escalável em termos de custo para ser implantado em produção
116