Escrevi um post no blog sobre como construímos um subagente auto-teste baseado em REPL para ir de 20 minutos a > 200 minutos de runtime autônomo no Agente 3 :) O principal problema que queríamos resolver era o problema dos LLMs gerarem apps que pareciam funcionar, mas que na verdade eram apenas mocks de alta fidelidade
A Replit está no ramo de criar aplicativos funcionais e descobriu que dar ao agente meios para auto-verificar é uma das principais aberturas para maior autonomia nos agentes
Ao construir uma interface semelhante a um notebook para o agente, descobrimos que isso desbloqueava um modo iterativo de teste muito humano, flexível e escalável em termos de custo para implantar em produção
101