La connessione residua in un modello transformer è solitamente implementata in uno di questi due modi: Pre-Norm: x + Layer(Norm(x)) Post-Norm: Norm(x + Layer(x)) In Un Quadro Matematico per i Circuiti Transformer, il flusso residuo è descritto come uno spazio di lavoro centrale interno.