Escribí una entrada en el blog sobre cómo construimos un subagente auto-prueba basado en REPL para pasar de 20 minutos a > 200 minutos de autonomía en el Agente 3 :) lo principal que queríamos resolver era el problema de los LLMs que generaban aplicaciones que parecían funcionar pero que en realidad eran solo mocks de alta fidelidad
Replit se dedica a crear aplicaciones funcionales y resulta que dar al agente la posibilidad de auto-verificar es una de las claves para lograr una mayor autonomía en los agentes
Al construir una interfaz tipo portátil para el agente, descubrimos que esto desbloqueaba un modo iterativo muy humano, flexible y escalable en coste para desplegar en producción
102