Det virker som dette kan føre til en mer naturlig nested agentmodell hvor en transformator kan trenes til å kjøre andre nevrale nettverk gjentatte ganger