ho scritto un post sul blog su come abbiamo costruito un sottogente di auto-test basato su REPL per passare da 20 minuti a 200 minuti di tempo di esecuzione autonomo in Agent 3 :) la cosa principale che volevamo risolvere era il problema degli LLM che generavano app che sembravano funzionare ma in realtà erano solo mock ad alta fedeltà.
replit è nel settore della creazione di app funzionanti e si scopre che fornire all'agente i mezzi per auto-verificarsi è uno dei fattori chiave per una maggiore autonomia negli agenti
creando un'interfaccia simile a un notebook per l'agente, abbiamo scoperto che questo ha sbloccato una modalità di test iterativa molto simile a quella umana, che era flessibile e scalabile in termini di costi per essere implementata in produzione
100