Um dos meus artigos favoritos nos últimos anos incluía este diagrama. Ele mostra o impacto de controlar três tipos diferentes de variáveis: confundidores, colididores e mediadores. Com os confundidores, o controle é bom. Com os outros, você arruína seu resultado ao controlar.
Se você tiver variáveis com erro de medição, pode se deparar com outra variável problemática: o proxy. As variáveis proxy podem tornar todas essas distorções muito piores e muito mais difíceis de lidar.
O artigo faz esta observação simples: o controlo estatístico requer justificação causal. Esse é, na verdade, o título. Eles deram vários exemplos baseados em DAG. Considere este: a edutainment é um confundidor ou um mediador? Deveria controlá-lo, ou isso prejudicaria a sua estimativa?
Isto é sempre algo que você tem que considerar, mas é, francamente, excecional pensar causalmente sobre o controlo estatístico. Muitos artigos fazem coisas como controlar por variáveis irrelevantes a montante (proxies), ou controlam involuntariamente mediadores. Essa é a norma!
O meu artigo aborda muitos mais problemas relacionados com o uso e o abuso de controlos. Por exemplo, menciona que pode ser necessário muitos dados e esforço para que a pontuação de propensão corresponda a experimentos:
Nota-se que uma determinada descoberta pode não significar o que diz que significa:
E isso mostra que até o padrão-ouro da inferência causal—o RCT—precisa ser feito corretamente, ou você acabará em uma situação onde suas estimativas de efeito estão inflacionadas e suas conclusões estão erradas.
55,82K