W tym dodatku streszczę kilka pomysłów na temat wnioskowania przyczynowego na podstawie danych nieeksperymentalnych w nieco bardziej matematycznej formie. Istnieją dwa główne podejścia: schemat wykresu przyczynowego, najbardziej związany z Judeą Pearl i współpracownikami, oraz ramy potencjalnych efektów, najbardziej związane z Donaldem Rubinem i współpracownikami. Przedstawię potencjalne ramy wyników, ponieważ są one bardziej związane z ideami Pearl, Glymour, and Jewell (2016) w notatkach matematycznych na końcu rozdziału 3 i 4. Aby uzyskać więcej informacji na temat schematów przyczynowych, polecam Pearl, Glymour, and Jewell (2016) (wprowadzenie ) i Pearl (2009) (zaawansowane). Jeśli chodzi o podejście oparte na długości książki, które łączy w sobie potencjalne ramy wyników i ramy wykresu przyczynowego, polecam Morgan and Winship (2014) .
Celem tego dodatku jest pomoc w zrozumieniu zapisów i stylów potencjalnych rezultatów, tak aby można było przejść do bardziej technicznego materiału napisanego na ten temat. Najpierw opiszę potencjalne ramy wyników. Następnie wykorzystam go do dalszych dyskusji na temat naturalnych eksperymentów, takich jak eksperyment Angrist (1990) na temat wpływu służby wojskowej na zarobki. Niniejszy dodatek w dużej mierze opiera się na Imbens and Rubin (2015) .
Potencjalne ramy wyników
Ramy potencjalnych efektów obejmują trzy główne elementy: jednostki , leczenie i potencjalne wyniki . Aby zilustrować te elementy, rozważmy stylizowaną wersję pytania Angrist (1990) w Angrist (1990) : Jaki jest wpływ służby wojskowej na zarobki? W tym przypadku możemy zdefiniować jednostki jako osoby uprawnione do wersji z 1970 roku w Stanach Zjednoczonych i możemy indeksować te osoby według \(i = 1, \ldots, N\) . Leczenie w tym przypadku może polegać na "służeniu w wojsku" lub "nie służeniu w wojsku". \(W_i = 1\) warunkami leczenia i kontroli, a ja napiszę \(W_i = 1\) jeśli osoba \(i\) jest w stanie leczenia i \(W_i = 0\) jeśli osoba \(i\) jest w stanie kontrolnym. Wreszcie, potencjalne wyniki są nieco bardziej koncepcyjnie trudne, ponieważ wiążą się z "potencjalnymi" wynikami; rzeczy, które mogły się wydarzyć. Dla każdej osoby, która kwalifikuje się do projektu z 1970 roku, możemy sobie wyobrazić kwotę, którą zarobiliby w 1978 roku, gdyby służyli w wojsku, który nazwiemy \(Y_i(1)\) , oraz kwotę, którą zarobiliby w 1978, jeśli nie służyli w wojsku, co ja nazywam \(Y_i(0)\) . W potencjalnym \(Y_i(1)\) wyników, \(Y_i(1)\) i \(Y_i(0)\) są uważane za ustalone wielkości, natomiast \(W_i\) jest zmienną losową.
Wybór jednostek, metod leczenia i wyników jest krytyczny, ponieważ określa to, czego nie można się nauczyć z badania. Wybór jednostek - osób uprawnionych do projektu z 1970 r. - nie obejmuje kobiet, a więc bez dodatkowych założeń, to badanie nie powie nam nic o wpływie służby wojskowej na kobiety. Ważne są również decyzje dotyczące sposobu leczenia i wyników. Na przykład, czy leczenie zainteresowania powinno skupiać się na służbie w wojsku lub doświadczaniu walki? Czy wynikiem odsetek powinny być zarobki lub satysfakcja z pracy? Ostatecznie wybór jednostek, metod leczenia i wyników powinien wynikać z naukowych i politycznych celów badania.
Biorąc pod uwagę wybory jednostek, zabiegi i potencjalne wyniki, przyczynowy wpływ leczenia na osobę \(i\) , \(\tau_i\) , jest
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Innymi słowy, porównujemy, ile osób \(i\) zarobiłoby po wyświetleniu, ile osób \(i\) zarabia bez wyświetlania. Dla mnie, eq. 2.1 jest najjaśniejszym sposobem zdefiniowania efektu przyczynowego, i chociaż jest niezwykle prosty, okazuje się, że ramy te można uogólniać na wiele ważnych i interesujących sposobów (Imbens and Rubin 2015) .
Podczas korzystania z potencjalnego schematu wyników często pomocne jest napisanie tabeli pokazującej potencjalne wyniki i efekty leczenia dla wszystkich jednostek (tabela 2.5). Jeśli nie jesteś w stanie wyobrazić sobie takiego stolika do swoich badań, być może będziesz musiał dokładniej zdefiniować swoje jednostki, metody leczenia i potencjalne wyniki.
Osoba | Zarobki w warunkach leczenia | Zysk w stanie kontrolnym | Efekt leczenia |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Oznaczać | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Definiując w ten sposób efekt przyczynowy, mamy jednak problem. Niemal we wszystkich przypadkach nie obserwujemy obu potencjalnych wyników. Oznacza to, że konkretna osoba służyła lub nie służyła. Dlatego obserwujemy jedno z potencjalnych rezultatów - \(Y_i(1)\) lub \(Y_i(0)\) - ale nie oba. Niemożność zaobserwowania obu potencjalnych wyników jest tak poważnym problemem, że Holland (1986) nazwał to Podstawowym Problemem Wnioskowania Przyczynowego .
Na szczęście, kiedy przeprowadzamy badania, nie mamy tylko jednej osoby; raczej mamy wielu ludzi, a to oferuje sposób wokół Podstawowego Problemu Wniosku Przyczynowego. Zamiast próbować oszacować efekt leczenia na poziomie indywidualnym, możemy oszacować średni efekt leczenia dla wszystkich jednostek:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
To równanie jest nadal wyrażone w kategoriach \(\tau_i\) , które są nieobserwowalne, ale z pewną algebrą (eq 2.8 Gerber and Green (2012) ), otrzymujemy
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Pokazuje to, że jeśli potrafimy oszacować średni wynik populacji w trakcie leczenia ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) i wynik średniej populacji pod kontrolą ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), możemy oszacować średni efekt leczenia, nawet bez oszacowania efektu leczenia dla konkretnej osoby.
Teraz, gdy zdefiniowałem nasz szacunek i to, co próbujemy oszacować, zwrócę się do tego, jak możemy to oszacować za pomocą danych. I tutaj bezpośrednio wkraczamy w problem, że obserwujemy tylko jedno z potencjalnych rezultatów dla każdej osoby; widzimy albo \(Y_i(0)\) lub \(Y_i(1)\) (tabela 2.6). Możemy oszacować średni efekt leczenia, porównując zarobki osób, które trafiły do zarobków osób, które nie obsługiwały:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
gdzie \(N_t\) i \(N_c\) to liczba osób w warunkach leczenia i kontroli. To podejście będzie działać dobrze, jeśli przypisanie leczenia jest niezależne od potencjalnych wyników, stan nazywany czasem nieświadomością . Niestety, przy braku eksperymentu, nierzetelność nie jest często zadowalająca, co oznacza, że estymator w równ. 2.4 raczej nie da dobrego oszacowania. Jednym ze sposobów myślenia o tym jest to, że w przypadku braku przypadkowego przypisania leczenia, eq. 2.4 nie porównuje się jak z podobnym; porównuje zarobki różnych rodzajów ludzi. Lub wyrażone nieco inaczej, bez przypadkowego przypisania leczenia, przydzielenie leczenia jest prawdopodobnie związane z potencjalnymi wynikami.
W rozdziale 4 opiszę, w jaki sposób randomizowane, kontrolowane eksperymenty mogą pomóc naukowcom dokonać szacunków przyczynowych, i tutaj opiszę, w jaki sposób naukowcy mogą skorzystać z naturalnych eksperymentów, takich jak loteria losowa.
Osoba | Zarobki w warunkach leczenia | Zysk w stanie kontrolnym | Efekt leczenia |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Oznaczać | ? | ? | ? |
Naturalne eksperymenty
Jednym ze sposobów dokonywania szacunków przyczynowych bez przeprowadzania eksperymentu jest poszukiwanie czegoś, co dzieje się w świecie, który losowo przypisał ci leczenie. Takie podejście nazywa się naturalnymi eksperymentami . W wielu sytuacjach natura nie losowo dostarcza leczenia, które chcesz do populacji. Ale czasami natura losowo zapewnia powiązane leczenie. W szczególności rozważę przypadek, w którym stosuje się leczenie wtórne, które zachęca ludzi do leczenia pierwotnego . Na przykład projekt można uznać za losowo przydzielone leczenie wtórne, które zachęciło niektóre osoby do podjęcia podstawowego leczenia, które służyło w wojsku. Ten projekt jest czasami nazywany projektem zachęty . A metoda analizy, którą opiszę, aby poradzić sobie z tą sytuacją, jest czasami nazywana zmiennymi instrumentalnymi . W tym ustawieniu, przy pewnych założeniach, badacze mogą skorzystać z zachęty, aby dowiedzieć się o wpływie pierwotnego leczenia dla określonego podzbioru jednostek.
Aby poradzić sobie z dwoma różnymi sposobami leczenia - zachętą i podstawowym leczeniem - potrzebujemy nowej notacji. Załóżmy, że niektóre osoby są losowo kreślone ( \(Z_i = 1\) ) lub nie zostały \(Z_i = 0\) ( \(Z_i = 0\) ); w tej sytuacji \(Z_i\) jest czasami nazywany instrumentem .
Spośród osób, które zostały sporządzone, niektóre zostały obsłużone ( \(Z_i = 1, W_i = 1\) ), a niektóre nie ( \(Z_i = 1, W_i = 0\) ). Podobnie, wśród tych, którzy nie zostali napisani, niektórzy służyli ( \(Z_i = 0, W_i = 1\) ), a niektórzy nie ( \(Z_i = 0, W_i = 0\) ). Potencjalne wyniki dla każdej osoby można teraz rozszerzyć, aby pokazać jej status zarówno dla zachęty, jak i leczenia. Na przykład niech \(Y(1, W_i(1))\) będzie zarobkami osoby \(i\) jeśli został napisany, gdzie \(W_i(1)\) jest jego stanem usługi, jeśli został napisany. Co więcej, możemy podzielić populację na cztery grupy: kompozytorzy, nigdy nie przyjmujący, przesądzający i zawsze przyjmujący (tabela 2.7).
Rodzaj | Usługa w przypadku opracowania | Usługa, jeśli nie została sporządzona |
---|---|---|
Compliers | Tak, \(W_i(Z_i=1) = 1\) | Nie, \(W_i(Z_i=0) = 0\) |
Nigdy nie biorący | Nie, \(W_i(Z_i=1) = 0\) | Nie, \(W_i(Z_i=0) = 0\) |
Defiers | Nie, \(W_i(Z_i=1) = 0\) | Tak, \(W_i(Z_i=0) = 1\) |
Zawsze chętni | Tak, \(W_i(Z_i=1) = 1\) | Tak, \(W_i(Z_i=0) = 1\) |
Zanim omówimy oszacowanie efektu leczenia (tj. Służby wojskowej), możemy najpierw zdefiniować dwa efekty zachęty (tj. Być przygotowanym). Po pierwsze, możemy zdefiniować wpływ zachęty na leczenie pierwotne. Po drugie, możemy zdefiniować wpływ zachęty na wynik. Okaże się, że te dwa efekty można połączyć, aby oszacować wpływ leczenia na określoną grupę osób.
Po pierwsze, efekt zachęty do leczenia można zdefiniować dla osoby \(i\) jako
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Co więcej, tę ilość można zdefiniować dla całej populacji jako
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Na koniec możemy oszacować \(\text{ITT} _{W}\) używając danych:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
gdzie \(\bar{W}^{\text{obs}}_1\) jest obserwowaną szybkością leczenia dla tych, którzy byli zachęcani i \(\bar{W}^{\text{obs}}_0\) jest obserwowany współczynnik leczenia dla tych, którzy nie byli zachęcani. \(\text{ITT}_W\) jest również czasami nazywane stopniem wykorzystania .
Następnie efekt zachęty dla wyniku można zdefiniować dla osoby \(i\) jako:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Co więcej, tę ilość można zdefiniować dla całej populacji jako
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Na koniec możemy oszacować \(\text{ITT}_{Y}\) używając danych:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
gdzie \(\bar{Y}^{\text{obs}}_1\) jest obserwowanym wynikiem (np. zarobki) dla tych, którzy byli zachęcani (np. przeciągnięto) i \(\bar{W}^{\text{obs}}_0\) jest obserwowanym wynikiem dla tych, którzy nie byli zachęcani.
Na koniec zwracamy uwagę na efekt zainteresowania: efekt pierwotnego leczenia (np. Służba wojskowa) na wynik (np. Zarobki). Niestety, okazuje się, że generalnie nie można oszacować tego wpływu na wszystkie jednostki. Jednak przy pewnych założeniach naukowcy mogą oszacować wpływ leczenia na kompilatory (tj. Osoby, które będą służyć, jeśli zostały sporządzone, oraz osoby, które nie będą służyć, jeśli nie zostaną przygotowane, tabela 2.7). Nazwę ten szacunek i średni wynikowy efekt (CACE) (który jest czasem nazywany lokalnym średnim efektem leczenia , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
gdzie \(G_i\) przekazuje grupę osób \(i\) (patrz tabela 2.7), a \(N_{\text{co}}\) to liczba kompilatorów. Innymi słowy, eq. 2.11 porównuje zarobki kompilatorów, które są kreślone \(Y_i(1, W_i(1))\) i nie zostały \(Y_i(0, W_i(0))\) . Estymat w równ. 2.11 wydaje się trudny do oszacowania na podstawie obserwowanych danych, ponieważ nie można zidentyfikować podmiotów zależnych wykorzystujących jedynie obserwowane dane (aby dowiedzieć się, czy ktoś jest komplementariuszem, trzeba by obserwować, czy służył on w trakcie sporządzania i czy służył, gdy nie został sporządzony).
Okazuje się - co nieco zaskakujące - że jeśli są jakieś kompilatory, to pod warunkiem, że postawimy trzy dodatkowe założenia, możliwe jest oszacowanie CACE na podstawie obserwowanych danych. Po pierwsze, należy założyć, że przypisanie do leczenia jest losowe. W przypadku loterii losowej jest to uzasadnione. Jednak w niektórych sytuacjach, w których naturalne eksperymenty nie opierają się na fizycznej randomizacji, to założenie może być bardziej problematyczne. Po drugie, należy założyć, że nie są to podmioty odstraszające (to założenie jest również nazywane założeniem monotoniczności). W kontekście projektu wydaje się zasadne założenie, że bardzo niewiele osób nie będzie służyć, jeśli zostanie sporządzona i będzie służyć, jeśli nie zostanie sporządzona. Po trzecie wreszcie najważniejsze jest założenie, które nazywa się ograniczeniem wykluczenia . W ramach ograniczenia wykluczenia należy przyjąć, że cały efekt przypisania leczenia przechodzi przez samo leczenie. Innymi słowy, należy założyć, że nie ma bezpośredniego wpływu zachęty na wyniki. Na przykład w przypadku loterii losowej należy założyć, że status projektu nie ma wpływu na zarobki inne niż na służbę wojskową (rysunek 2.11). Ograniczenie wykluczenia może zostać naruszone, jeśli na przykład ludzie, którzy zostali powołani, spędzają więcej czasu w szkole, aby uniknąć służby lub gdyby pracodawcy rzadziej zatrudniali ludzi, którzy zostali powołani.
Jeśli te trzy warunki (przypadkowe przypisanie do leczenia, brak osób rzucających wyzwanie i ograniczenie wykluczenia) są spełnione, to
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
więc możemy oszacować CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Jednym ze sposobów myślenia o CACE jest to, że jest to różnica w wynikach między tymi, których zachęcono, a tymi, których nie zachęcono, zawyżonymi przez wskaźnik wykorzystania.
Istnieją dwa ważne zastrzeżenia, o których należy pamiętać. Po pierwsze, ograniczenie wykluczenia jest mocnym założeniem i musi być uzasadnione indywidualnie dla każdego przypadku, co często wymaga wiedzy eksperckiej. Ograniczenie wykluczenia nie może być uzasadnione randomizacją zachęt. Po drugie, wspólnym praktycznym wyzwaniem z analizą zmiennych instrumentalnych jest, gdy zachęta ma niewielki wpływ na przyjmowanie leczenia (gdy \(\text{ITT}_W\) jest mały). Nazywa się to słabym instrumentem i prowadzi do różnych problemów (Imbens and Rosenbaum 2005; Murray 2006) . Jednym ze sposobów myślenia o słabych instrumentach jest to, że \(\widehat{\text{CACE}}\) może być wrażliwy na małe błędy w \(\widehat{\text{ITT}_Y}\) powodu naruszenia ograniczenia wykluczenia - ponieważ te uprzedzenia są powiększane przez małe \(\widehat{\text{ITT}_W}\) (patrz \(\widehat{\text{ITT}_W}\) 2.13). Z grubsza, jeśli leczenie, które przypisuje natura, nie ma dużego wpływu na leczenie, na którym ci zależy, to będziesz mieć trudności z poznaniem leczenia, na które ci zależy.
Zobacz rozdział 23 i 24 Imbens and Rubin (2015) aby uzyskać bardziej formalną wersję tej dyskusji. Tradycyjne podejście ekonometryczne do zmiennych instrumentalnych jest zwykle wyrażane w kategoriach szacowania równań, a nie potencjalnych wyników. Aby zapoznać się z tą inną perspektywą, zobacz Angrist and Pischke (2009) , i dla porównania między tymi dwoma podejściami, patrz rozdział 24.6 Imbens and Rubin (2015) . Alternatywna, nieco mniej formalna prezentacja podejścia do zmiennych instrumentalnych została przedstawiona w rozdziale 6 podręcznika Gerber and Green (2012) . Aby uzyskać więcej informacji na temat ograniczenia wykluczeń, zobacz D. Jones (2015) . Aronow and Carnegie (2013) opisują dodatkowy zestaw założeń, które można wykorzystać do oszacowania ATE, a nie CACE. Aby dowiedzieć się więcej o tym, jak naturalne eksperymenty mogą być trudne do zinterpretowania, zobacz Sekhon and Titiunik (2012) . Bardziej ogólne wprowadzenie do naturalnych eksperymentów - coś, co wykracza poza samo podejście do zmiennych instrumentalnych, obejmuje także projekty takie jak brak ciągłości regresji - patrz Dunning (2012) .