escribí una entrada de blog sobre cómo construimos un subagente de autoevaluación basado en REPL para pasar de 20 minutos a 200 minutos de tiempo de ejecución autónoma en el Agente 3 :) lo principal que queríamos resolver era el problema de los LLMs que generaban aplicaciones que parecían funcionar pero que en realidad eran solo simulaciones de alta fidelidad.
replit está en el negocio de crear aplicaciones funcionales y resulta que dar al agente medios para auto-verificarse es uno de los desbloqueos clave para una mayor autonomía en los agentes
al construir una interfaz similar a un cuaderno para el agente, descubrimos que esto desbloqueaba un modo de prueba muy humano y iterativo que era flexible y escalable en costos para desplegar en producción
103