În această anexă, voi rezuma câteva idei despre realizarea inferenței cauzale din datele non-experimentale într-o formă puțin mai matematică. Există două abordări principale: cadrul de diagramă cauzal, cel mai asociat cu Iudeea Pearl și colegii, și cadrul de rezultate potențiale, cele mai multe asociate cu Donald Rubin și colegii. Voi introduce cadrul de rezultate potențiale, deoarece este mai strâns legat de ideile din notele matematice de la sfârșitul capitolelor 3 și 4. Pentru mai multe detalii despre cadrul grafurilor cauzale, recomand Pearl, Glymour, and Jewell (2016) (introductiv ) și Pearl (2009) (avansat). Pentru un tratament pentru lungimea de carte a inferenței cauzale care combină cadrul potențial de rezultate și cadrul de diagramă cauzal, recomand Morgan and Winship (2014) .
Scopul acestei anexe este de a vă ajuta să vă simțiți confortabil cu notația și stilul tradiției potențialelor rezultate, astfel încât să puteți trece la un material mai tehnic scris pe această temă. În primul rând, voi descrie cadrul potențial de rezultate. Apoi, o să o folosesc pentru a discuta în continuare experimentele naturale precum cea a lui Angrist (1990) privind efectul serviciului militar asupra câștigurilor salariale. Această anexă atrage foarte mult pe Imbens and Rubin (2015) .
Cadrul potențial al rezultatelor
Cadrul potențial al rezultatelor are trei elemente principale: unități , tratamente și rezultate potențiale . Pentru a ilustra aceste elemente, să luăm în considerare o versiune stilizată a întrebării adresate în Angrist (1990) : Care este efectul serviciului militar asupra câștigurilor salariale? În acest caz, putem defini unitățile ca persoane eligibile pentru proiectul din 1970 în Statele Unite și le putem indexa pe acești oameni prin \(i = 1, \ldots, N\) . Tratamentele în acest caz pot fi "servind în armată" sau "nu servesc în armată". Voi numi aceste condiții de tratament și de control și voi scrie \(W_i = 1\) dacă persoana \(i\) este în starea de tratament și \(W_i = 0\) dacă persoana \(i\) se află în starea de control. În cele din urmă, rezultatele potențiale sunt mai dificil din punct de vedere conceptual, deoarece implică rezultate "potențiale"; lucruri care s-ar fi putut întâmpla. Pentru fiecare persoană eligibilă pentru proiectul din 1970, ne putem imagina suma pe care ar fi câștigat-o în 1978 dacă ar servi în armată, pe care o voi numi \(Y_i(1)\) și suma pe care ar fi câștigat-o 1978 dacă nu au servit în armată, pe care o voi numi \(Y_i(0)\) . În cadrul potențialului de rezultate, \(Y_i(1)\) și \(Y_i(0)\) sunt considerate cantități fixe, în timp ce \(W_i\) este o variabilă aleatoare.
Alegerea unităților, tratamentelor și rezultatelor este critică deoarece definește ce poate și nu poate fi învățat din studiu. Alegerea unităților - persoane eligibile pentru proiectul din 1970 - nu include femeile și, astfel, fără presupuneri suplimentare, acest studiu nu ne va spune nimic despre efectul serviciului militar asupra femeilor. De asemenea, sunt importante decizii privind modul de definire a tratamentelor și a rezultatelor. De exemplu, în cazul în care tratamentul de interes ar trebui să se concentreze asupra servirii militare sau a luptei? În cazul în care rezultatul interesului ar fi câștigurile sau satisfacția profesională? În cele din urmă, alegerea unităților, a tratamentelor și a rezultatelor ar trebui să fie condusă de obiectivele științifice și de politici ale studiului.
Având în vedere alegerile de unități, tratamente și rezultate potențiale, efectul cauzal al tratamentului asupra persoanei \(i\) , \(\tau_i\) este
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Cu alte cuvinte, vom compara cât de mult persoana \(i\) ar fi câștigat după difuzarea la modul în care persoana de mult \(i\) ar fi câștigat fără servire. Pentru mine, eq. 2.1 este cel mai clar mod de definire a unui efect cauzal și, deși extrem de simplu, acest cadru se dovedește a fi generalizabil în multe moduri importante și interesante (Imbens and Rubin 2015) .
Când folosesc cadrul de rezultate potențiale, adesea găsesc util să scriu un tabel care prezintă rezultatele potențiale și efectele tratamentului pentru toate unitățile (tabelul 2.5). Dacă nu vă puteți imagina un tabel ca acesta pentru studiul dvs., atunci este posibil să fiți mai precis în definițiile dvs. privind unitățile, tratamentele și rezultatele potențiale.
Persoană | Câștiguri în starea de tratament | Câștigurile în stare de control | Efectul de tratament |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Însemna | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Când definim efectul cauzal în acest fel, cu toate acestea, ne confruntăm cu o problemă. În aproape toate cazurile, nu putem observa ambele rezultate potențiale. Adică, o persoană specifică a servit sau nu a servit. Prin urmare, observăm unul dintre rezultatele potențiale - \(Y_i(1)\) sau \(Y_i(0)\) - dar nu ambele. Incapacitatea de a observa ambele rezultate potențiale este o problemă majoră pe care Holland (1986) numește Problema fundamentală a Inferenței cauzale .
Din fericire, când facem cercetări, nu avem doar o singură persoană; mai degrabă, avem mulți oameni și aceasta oferă o cale în jurul problemei fundamentale a inferenței cauzale. În loc să încercăm să estimăm efectul tratamentului la nivel individual, putem estima efectul mediu de tratament pentru toate unitățile:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Această ecuație este încă exprimată în termenii \(\tau_i\) , care sunt neobservabile, dar cu o anumită algebră (eq 2.8 de Gerber and Green (2012) ), obținem
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Acest lucru arată că , dacă putem estima populația rezultatul mediu sub tratament ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) și rezultatul mediu al populației sub control ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), atunci putem estima efectul mediu de tratament, chiar fara a estima efectul tratamentului pentru o anumita persoana.
Acum că am definit estimarea noastră - lucrul pe care încercăm să-l estimam - mă voi îndrepta spre modul în care o putem estima efectiv cu datele. Și aici tragem direct în problema că observăm doar unul dintre rezultatele potențiale pentru fiecare persoană; vedem fie \(Y_i(0)\) sau \(Y_i(1)\) (tabelul 2.6). Am putea estima efectul mediu de tratament prin compararea veniturilor persoanelor care au servit la câștigurile persoanelor care nu au servit:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
unde \(N_t\) și \(N_c\) sunt numerele de persoane aflate în condițiile de tratament și de control. Această abordare va funcționa bine dacă atribuirea tratamentului este independentă de rezultatele potențiale, o afecțiune numită uneori ignorabilitate . Din nefericire, în absența unui experiment, ignorabilitatea nu este adesea satisfăcută, ceea ce înseamnă că estimatorul din eq. 2.4 nu este probabil să producă o estimare bună. O modalitate de a gândi este că, în absența repartizării aleatorii a tratamentului, eq. 2.4 nu se compara cu altele asemănătoare; compară câștigurile diferitelor persoane. Sau exprimat ușor diferit, fără alocarea aleatorie a tratamentului, alocarea tratamentului este probabil legată de rezultatele potențiale.
În capitolul 4, voi descrie cum experimentele controlate randomizate pot ajuta cercetătorii să facă estimări cauzale și aici voi descrie modul în care cercetătorii pot profita de experimentele naturale, cum ar fi proiectul de loterie.
Persoană | Câștiguri în starea de tratament | Câștigurile în stare de control | Efectul de tratament |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Însemna | ? | ? | ? |
Experimente naturale
O abordare pentru a face estimări cauzale fără a rula un experiment este de a căuta ceva care se întâmplă în lumea care a alocat întâmplător un tratament pentru tine. Această abordare se numește experimente naturale . În multe situații, din păcate, natura nu oferă în mod aleatoriu tratamentul pe care îl doriți populației de interes. Dar, uneori, natura oferă la întâmplare un tratament asociat. În special, voi examina cazul în care există un tratament secundar care încurajează persoanele să primească tratamentul primar . De exemplu, proiectul ar putea fi considerat un tratament secundar alocat întâmplător, care a încurajat unii oameni să ia tratamentul primar, care era servit în armată. Acest design este denumit uneori un design de încurajare . Iar metoda de analiză pe care o voi descrie pentru a face față acestei situații este uneori numită variabile instrumentale . În acest context, cu unele ipoteze, cercetătorii pot folosi încurajarea pentru a afla despre efectul tratamentului primar pentru un anumit subset de unități.
Pentru a trata cele două tratamente diferite - încurajarea și tratamentul primar - avem nevoie de o nouă notație. Să presupunem că unii oameni sunt proiectați la întâmplare ( \(Z_i = 1\) ) sau nu sunt proiectați ( \(Z_i = 0\) ); în această situație, \(Z_i\) este numit uneori un instrument .
Dintre cei care au fost proiectați, unii au servit ( \(Z_i = 1, W_i = 1\) ) și unii nu au ( \(Z_i = 1, W_i = 0\) ). De asemenea, printre cei care nu au fost elaborați, unii au servit ( \(Z_i = 0, W_i = 1\) ) și unii nu au ( \(Z_i = 0, W_i = 0\) ). Rezultatele potențiale pentru fiecare persoană pot fi acum extinse pentru a arăta statutul lor atât pentru încurajare, cât și pentru tratament. De exemplu, \(Y(1, W_i(1))\) este câștigul persoanei \(i\) dacă a fost redactat, unde \(W_i(1)\) Mai mult, putem împărți populația în patru grupe: complierii, cei care nu-i iau, se sfătuiește și întotdeauna (tabelul 2.7).
Tip | Serviciul dacă este redactat | Serviciul dacă nu este elaborat |
---|---|---|
compliers | Da, \(W_i(Z_i=1) = 1\) | Nu, \(W_i(Z_i=0) = 0\) |
Niciodată factorii | Nu, \(W_i(Z_i=1) = 0\) | Nu, \(W_i(Z_i=0) = 0\) |
Defiers | Nu, \(W_i(Z_i=1) = 0\) | Da, \(W_i(Z_i=0) = 1\) |
Întotdeauna factorii | Da, \(W_i(Z_i=1) = 1\) | Da, \(W_i(Z_i=0) = 1\) |
Înainte de a discuta despre estimarea efectului tratamentului (adică, serviciul militar), putem defini mai întâi două efecte ale încurajării (adică, fiind elaborate). În primul rând, putem defini efectul încurajării asupra tratamentului primar. În al doilea rând, putem defini efectul încurajării asupra rezultatului. Se va dovedi că aceste două efecte pot fi combinate pentru a oferi o estimare a efectului tratamentului asupra unui anumit grup de persoane.
În primul rând, efectul încurajării asupra tratamentului poate fi definit pentru persoana \(i\) ca
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Mai mult, această cantitate poate fi definită pe întreaga populație ca
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
În cele din urmă, putem estima \(\text{ITT} _{W}\) folosind date:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
unde \(\bar{W}^{\text{obs}}_1\) este rata de tratament observată pentru cei care au fost încurajați și \(\bar{W}^{\text{obs}}_0\) rata de tratament observată pentru cei care nu au fost încurajați. \(\text{ITT}_W\) este, de asemenea, numit rata de absorbție .
Apoi, efectul încurajării asupra rezultatului poate fi definit pentru persoana \(i\) ca fiind:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Mai mult, această cantitate poate fi definită pe întreaga populație ca
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
În cele din urmă, putem estima \(\text{ITT}_{Y}\) folosind date:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
unde \(\bar{Y}^{\text{obs}}_1\) este rezultatul observat (de exemplu, câștigurile) pentru cei care au fost încurajați (de exemplu, elaborați) și \(\bar{W}^{\text{obs}}_0\) este rezultatul observat pentru cei care nu au fost încurajați.
În cele din urmă, ne îndreptăm atenția asupra efectului de interes: efectul tratamentului primar (de exemplu, serviciul militar) asupra rezultatului (de exemplu, câștigurile). Din păcate, se pare că, în general, nu se poate estima acest efect asupra tuturor unităților. Cu toate acestea, cu unele presupuneri, cercetătorii pot estima efectul tratamentului asupra complianților (de exemplu, oamenii care vor servi dacă sunt pregătiți și cei care nu vor servi dacă nu sunt pregătiți, tabelul 2.7). Voi numi această estimare și efectul mediu cauzal al compilatorului (CACE) (care este uneori numit efectul mediu de tratament local , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
unde \(G_i\) dă grupul de persoană \(i\) (vezi tabelul 2.7) și \(N_{\text{co}}\) este numărul de compilatori. Cu alte cuvinte, eq. 2.11 compară câștigurile compilatorilor care au fost elaborați \(Y_i(1, W_i(1))\) și nu au fost elaborați \(Y_i(0, W_i(0))\) . Estimarea în eq. 2.11 pare greu de estimat din datele observate, deoarece nu este posibilă identificarea complianților folosind doar datele observate (pentru a ști dacă cineva este compilator, ar trebui să observați dacă el a servit când a fost întocmit și dacă a servit când nu a fost elaborat).
Se pare - într-o oarecare măsură surprinzător - că, dacă există alți complianți, cu condiția să se facă trei ipoteze suplimentare, este posibil să se estimeze CACE din datele observate. În primul rând, trebuie să presupunem că asignarea la tratament este întâmplătoare. În cazul loteriei, acest lucru este rezonabil. Cu toate acestea, în anumite situații în care experimentele naturale nu se bazează pe o randomizare fizică, această ipoteză poate fi mai problematică. În al doilea rând, trebuie să presupunem că nu sunt defrime (această presupunere este, uneori, numită ipoteza monotonicității). În contextul proiectului, pare rezonabil să presupunem că există foarte puțini oameni care nu vor servi dacă sunt elaborați și vor servi dacă nu sunt elaborați. În al treilea rând, și în cele din urmă, vine cea mai importantă presupunere, numită restricție de excludere . Sub restricția de excludere, trebuie să presupunem că tot efectul alocării tratamentului este trecut prin tratamentul propriu-zis. Cu alte cuvinte, trebuie să presupunem că nu există un efect direct de încurajare a rezultatelor. În cazul loteriei de proiect, de exemplu, trebuie să presupunem că proiectul de statut nu are niciun efect asupra câștigurilor, altele decât prin serviciul militar (figura 2.11). Restricția de excludere ar putea fi încălcată dacă, de exemplu, persoanele care au fost elaborate au petrecut mai mult timp în școală pentru a evita serviciul sau dacă angajatorii erau mai puțin probabil să angajeze persoane care au fost elaborate.
Dacă sunt îndeplinite aceste trei condiții (repartizarea aleatorie a tratamentului, defriere și restricția de excludere)
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
astfel încât să putem estima CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
O modalitate de a gândi despre CACE este că diferența dintre rezultatele celor încurajate și cele neîncurajate, umflate de rata de absorbție, este diferită.
Există două avertismente importante care trebuie păstrate în minte. În primul rând, restricția de excludere este o ipoteză puternică și trebuie justificată de la caz la caz, ceea ce necesită adesea expertiză în materie. Restricția de excludere nu poate fi justificată prin randomizarea încurajării. În al doilea rând, o provocare practică comună cu analiza variabilă instrumentală vine atunci când încurajarea are un efect redus asupra preluării tratamentului (atunci când \(\text{ITT}_W\) este mic). Aceasta se numește un instrument slab și conduce la o varietate de probleme (Imbens and Rosenbaum 2005; Murray 2006) . O modalitate de a ne gândi la problema cu instrumentele slabe este că \(\widehat{\text{CACE}}\) poate fi sensibil la mici părtinire în \(\widehat{\text{ITT}_Y}\) - încălcări ale restricției de excludere - deoarece aceste prejudecăți se amplifică printr-un mic \(\widehat{\text{ITT}_W}\) (a se vedea ecuația 2.13). Aproximativ, dacă tratamentul pe care natura îl atribuie nu are un impact major asupra tratamentului care vă interesează, atunci veți avea dificultăți în a învăța despre tratamentul care vă interesează.
Vezi capitolele 23 și 24 din Imbens and Rubin (2015) pentru o versiune mai formală a acestei discuții. Abordarea econometrică tradițională a variabilelor instrumentale este exprimată în mod tipic în ceea ce privește estimarea ecuațiilor, nu și a rezultatelor potențiale. Pentru o introducere din această altă perspectivă, vezi Angrist and Pischke (2009) , iar pentru o comparație între cele două abordări, vezi secțiunea 24.6 din Imbens and Rubin (2015) . O prezentare alternativă, puțin mai puțin formală a abordării variabilelor instrumentale este prezentată în capitolul 6 al lui Gerber and Green (2012) . Pentru mai multe despre restricția de excludere, a se vedea D. Jones (2015) . Aronow and Carnegie (2013) descriu un set suplimentar de ipoteze care pot fi utilizate pentru estimarea ATE mai degrabă decât CACE. Pentru mai multe despre modul în care experimentele naturale pot fi foarte dificil de interpretat, a se vedea Sekhon and Titiunik (2012) . Pentru o introducere mai generală a experimentelor naturale - una care depășește doar abordarea variabilelor instrumentale pentru a include, de asemenea, modele cum ar fi discontinuitatea de regresie - a se vedea Dunning (2012) .