Sembra che questo potrebbe portare a un modello di agente annidato più naturale in cui un trasformatore può essere addestrato per eseguire ricorrentemente altre reti neurali