В одній з моїх улюблених статей останніх років була ця діаграма. Він показує вплив керування для трьох різних типів змінних: конфаундерів, колайдерів і медіаторів. З конфаундерами контроль хороший. З іншими ви руйнуєте свій результат, контролюючи.
Якщо у вас є змінні з похибкою вимірювання, ви можете зіткнутися з іншою проблемною змінною: проксі. Проксі-змінні можуть зробити всі ці спотворення набагато гіршими та набагато складнішими для боротьби.
У статті зроблено таке просте спостереження: статистичний контроль вимагає причинно-наслідкового обґрунтування. Власне, це і є назва. Вони навели кілька прикладів на основі DAG. Подумайте ось про що: едьютейнмент – це перешкода чи посередник? Чи варто його контролювати, чи це вплине на вашу оцінку?
Це завжди потрібно враховувати, але, чесно кажучи, це винятково – думати про статистичний контроль причинно-наслідково. Багато статей роблять такі речі, як контроль за нерелевантними низхідними змінними (проксі), або вони ненавмисно контролюють медіаторів. Це норма!
У моїй статті розглядається набагато більше питань з використанням і неправильним використанням елементів управління. Наприклад, у ньому зазначається, що може знадобитися багато даних і зусиль, щоб отримати оцінку схильності до відповідності експериментам:
Він зазначає, що дана знахідка може означати не те, про що вона говорить:
І це показує, що навіть золотий стандарт причинно-наслідкового висновку — РКД — має бути виконаний правильно, інакше ви опинитеся в ситуації, коли ваші оцінки ефекту завищені, а ваші висновки неправильні.
43,54K