Finalmente trovato un buon caso d'uso per i subagenti. Rendi i modelli di policy più intelligenti costruendo automaticamente ambienti RL dai dati delle attività del mondo reale. Cavolo, funziona davvero!