Uno dei miei articoli preferiti degli ultimi anni includeva questo diagramma. Mostra l'impatto del controllo su tre diversi tipi di variabili: confondenti, collisori e mediatori. Con i confondenti, il controllo è positivo. Con gli altri, rovini il tuo risultato controllando.
Se hai variabili con errore di misurazione, puoi incorrere in un'altra variabile problematica: il proxy. Le variabili proxy possono rendere tutte queste distorsioni molto peggiori e molto più difficili da gestire.
Il documento fa questa semplice osservazione: il controllo statistico richiede una giustificazione causale. Questo è in realtà il titolo. Hanno fornito diversi esempi basati su DAG. Considera questo: l'edutainment è un confonditore o un mediatore? Dovresti controllarlo, o questo distorcerebbe la tua stima?
Questo è sempre qualcosa che devi considerare, ma è, francamente, eccezionale pensare in modo causale al controllo statistico. Molti articoli fanno cose come controllare per variabili downstream irrilevanti (proxy), o controllano involontariamente per mediatori. Questa è la norma!
Il mio articolo affronta molte più questioni relative all'uso e all'abuso dei controlli. Ad esempio, osserva che può richiedere molti dati e sforzi per far corrispondere il punteggio di propensione agli esperimenti:
Si osserva che un dato risultato potrebbe non significare ciò che afferma di significare:
E dimostra che anche il gold standard dell'inferenza causale—l'RCT—deve essere eseguito correttamente, altrimenti ti ritroverai in una situazione in cui le tue stime degli effetti sono gonfiate e le tue conclusioni sono sbagliate.
43,54K