En aquest apèndix, vaig a resumir algunes idees sobre com fer inferència causal a partir de dades no experimentals d'una forma lleugerament més matemàtica. Hi ha dos enfocaments principals: el marc del gràfic causal, més associat amb Judea Pearl i els seus companys, i el marc de resultats potencials, més associat amb Donald Rubin i col·legues. Vaig a introduir el marc de resultats potencials perquè està més relacionat amb les idees de les notes matemàtiques al final del capítol 3 i 4. Per obtenir més informació sobre el marc de gràfics causals, recomano Pearl, Glymour, and Jewell (2016) (introducció ) i Pearl (2009) (avançat). Per un tractament de longitud d'inferència causal que combina el marc de resultats potencials i el marc del gràfic causal, recomano Morgan and Winship (2014) .
L'objectiu d'aquest apèndix és ajudar-vos a sentir-vos còmode amb la notació i l'estil de la tradició de resultats potencials perquè pugueu transitar a algun dels materials més tècnics escrits sobre aquest tema. En primer lloc, vaig a descriure el marc de resultats potencials. Llavors, ho utilitzaré per discutir més sobre experiments naturals com el d' Angrist (1990) sobre l'efecte del servei militar sobre els ingressos. Aquest apèndix es basa molt en Imbens and Rubin (2015) .
Marc de resultats potencials
El marc de resultats potencials té tres elements principals: unitats , tractaments i resultats potencials . Per il·lustrar aquests elements, considerem una versió estilitzada de la pregunta dirigida a Angrist (1990) : Quin és l'efecte del servei militar sobre els guanys? En aquest cas, podem definir les unitats com a persones aptes per a l'esborrany de 1970 als Estats Units, i podem indexar aquestes persones per \(i = 1, \ldots, N\) . Els tractaments en aquest cas poden ser "servir a l'exèrcit" o "no servir a l'exèrcit". Vaig a trucar a aquestes condicions de tractament i control, i vaig a escriure \(W_i = 1\) si la persona \(i\) es troba en la condició de tractament i \(W_i = 0\) si la persona \(i\) està en la condició de control. Finalment, els resultats potencials són més conceptualment difícils perquè impliquen resultats "potencials"; coses que podrien haver succeït. Per a cada persona elegible per a l'esborrany de 1970, podem imaginar l'import que haurien obtingut el 1978 si van servir a l'exèrcit, que anomenaré \(Y_i(1)\) , i la quantitat que haurien obtingut 1978 si no van servir a l'exèrcit, que anomenaré \(Y_i(0)\) . En el marc de resultats potencials, \(Y_i(1)\) i \(Y_i(0)\) es consideren quantitats fixes, mentre que \(W_i\) és una variable aleatòria.
L'elecció d'unitats, tractaments i resultats és fonamental, ja que defineix el que pot i no es pot aprendre de l'estudi. L'elecció d'unitats -personalment elegible per a l'esborrany de 1970- no inclou dones, de manera que sense suposicions addicionals, aquest estudi no ens informarà sobre l'efecte del servei militar a les dones. Les decisions sobre com definir els tractaments i els resultats també són importants. Per exemple, si el tractament d'interès se centri a servir en combat militar o experimentat? El resultat de l'interès hauria de ser un guany o una satisfacció laboral? En definitiva, l'elecció d'unitats, tractaments i resultats hauria de ser impulsada pels objectius científics i polítics de l'estudi.
Donades les opcions d'unitats, tractaments i resultats potencials, l'efecte causal del tractament a la persona \(i\) , \(\tau_i\) , és
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Dit d'una altra manera, comparem la quantitat de persona que \(i\) hauria obtingut després de servir a quanta persona \(i\) s'hauria guanyat sense servir. Per a mi, eq. 2.1 és la manera més clara de definir un efecte causal, i encara que extremadament senzill, aquest marc resulta generalizable de moltes maneres importants i interessants (Imbens and Rubin 2015) .
Quan utilitzo el marc de resultats potencials, sovint em sembla útil escriure una taula que mostra els resultats potencials i els efectes del tractament per a totes les unitats (taula 2.5). Si no podeu imaginar una taula com aquesta per al vostre estudi, potser haureu de ser més precisa en les vostres definicions de les vostres unitats, tractaments i resultats potencials.
Persona | Beneficis en la condició de tractament | Ingressos en condicions de control | Efecte del tractament |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Significar | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
En definir l'efecte causal d'aquesta manera, però, ens trobem amb un problema. En gairebé tots els casos, no arribem a observar els dos resultats potencials. És a dir, una persona específica va servir o no va servir. Per tant, observem un dels resultats potencials: \(Y_i(1)\) o \(Y_i(0)\) -però no tots dos. La incapacitat d'observar els dos resultats potencials és un problema tan important que Holland (1986) anomenar el problema fonamental de la inferència causal .
Afortunadament, quan fem investigacions, no tenim només una persona; en lloc d'això, tenim moltes persones, i això ofereix un camí al voltant del problema fonamental d'inferència causal. En lloc d'intentar estimar l'efecte del tractament a nivell individual, podem estimar l' efecte terapèutic mitjà de totes les unitats:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Aquesta equació encara s'expressa en termes de \(\tau_i\) , que no es poden observar, però amb algun àlgebra (eq 2.8 de Gerber and Green (2012) ), obtenim
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Això demostra que si podem estimar el resultat mitjà de la població sota tractament ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) i el resultat mitjà de la població sota control ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), podem estimar l'efecte mitjà del tractament, fins i tot sense estimar l'efecte del tractament per a cap persona en particular.
Ara que he definit la nostra estimació: el que estem tractant d'estimar, ens referirem a com podem estimar-lo amb dades. I aquí ens dirigim directament al problema que només observem un dels resultats potencials per a cada persona; veiem \(Y_i(0)\) o \(Y_i(1)\) (taula 2.6). Podríem estimar l'efecte mitjà del tractament mitjançant la comparació dels guanys de les persones que van servir als guanys de les persones que no van servir:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
on \(N_t\) i \(N_c\) són el nombre de persones en les condicions de tractament i control. Aquest enfocament funcionarà bé si l'assignació del tractament és independent dels resultats potencials, una condició de vegades anomenada ignorabilitat . Malauradament, en absència d'un experiment, la ignorabilitat no sol ser satisfeta, el que significa que l'estimador en eq. 2.4 no és probable que produeixi una bona estimació. Una manera de pensar-hi és que, en absència d'assignació aleatòria del tractament, l'equació 2.4 no es compara igual amb com; està comparant els guanys de diferents tipus de persones. O s'expressa lleugerament diferent, sense assignació aleatòria del tractament, l'assignació del tractament probablement està relacionada amb resultats potencials.
En el capítol 4, vaig a descriure com els experiments controlats aleatoris poden ajudar els investigadors a fer estimacions causals, i aquí vaig a descriure com els investigadors poden aprofitar els experiments naturals, com ara el projecte de loteria.
Persona | Beneficis en la condició de tractament | Ingressos en condicions de control | Efecte del tractament |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Significar | ? | ? | ? |
Experiments naturals
Un enfocament per fer estimacions causals sense executar un experiment és buscar alguna cosa que succeeixi al món que li hagi assignat un tractament aleatori per a vostè. Aquest enfocament s'anomena experiments naturals . En moltes situacions, malauradament, la natura no lliura aleatòriament el tractament que desitgeu a la població d'interès. Però, de vegades, la natura lliura aleatòriament un tractament relacionat. En particular, vaig a considerar el cas en què hi ha algun tractament secundari que encoratja a les persones a rebre el tractament primari . Per exemple, l'esborrany podria considerar-se un tractament secundari assignat aleatòriament que va animar a algunes persones a prendre el tractament primari, que estava servint a l'exèrcit. Aquest disseny es denomina de vegades un disseny d'estímul . I el mètode d'anàlisi que vaig a descriure per manejar aquesta situació de vegades es denomina variables instrumentals . En aquest context, amb alguns supòsits, els investigadors poden utilitzar l'estímul per conèixer l'efecte del tractament primari d'un determinat subconjunt d'unitats.
Per tractar els dos tractaments diferents: l'alè i el tractament primari, necessitem una notació nova. Suposem que algunes persones són redactats aleatòriament ( \(Z_i = 1\) ) o no redactats ( \(Z_i = 0\) ); En aquesta situació, \(Z_i\) se sol denominar un instrument .
Entre els que van ser redactats, alguns van servir ( \(Z_i = 1, W_i = 1\) ) i alguns no ( \(Z_i = 1, W_i = 0\) ). De la mateixa manera, entre els que no estaven redactats, alguns van servir ( \(Z_i = 0, W_i = 1\) ) i alguns no ( \(Z_i = 0, W_i = 0\) ). Els resultats potencials per a cada persona ara es poden ampliar per mostrar el seu estat, tant per a l'estímul com per al tractament. Per exemple, deixeu que \(Y(1, W_i(1))\) siguin els ingressos de la persona \(i\) si va ser redactat, on \(W_i(1)\) és el seu estat de servei si està redactat. A més, podem dividir la població en quatre grups: complidors, no prescriptors, desafiadors, i sempre (taula 2.7).
Escriviu | Servei si està redactat | Servei si no es redacta |
---|---|---|
Compliants | Sí, \(W_i(Z_i=1) = 1\) | No, \(W_i(Z_i=0) = 0\) |
Els que no prenen mai | No, \(W_i(Z_i=1) = 0\) | No, \(W_i(Z_i=0) = 0\) |
Defiers | No, \(W_i(Z_i=1) = 0\) | Sí, \(W_i(Z_i=0) = 1\) |
Sempre els que prenen | Sí, \(W_i(Z_i=1) = 1\) | Sí, \(W_i(Z_i=0) = 1\) |
Abans de discutir l'estimació de l'efecte del tractament (és a dir, el servei militar), primer podem definir dos efectes de l'alè (és a dir, redactats). En primer lloc, podem definir l'efecte de l'estímul en el tractament primari. En segon lloc, podem definir l'efecte de l'estímul sobre el resultat. Resultarà que aquests dos efectes es poden combinar per a proporcionar una estimació de l'efecte del tractament en un grup específic de persones.
En primer lloc, es pot definir l'efecte de l'estímul al tractament per a la persona \(i\) com
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
A més, aquesta quantitat es pot definir sobre tota la població com
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Finalment, podem estimar \(\text{ITT} _{W}\) utilitzant dades:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
on \(\bar{W}^{\text{obs}}_1\) és la taxa observada de tractament per a aquells que van ser encoratjats i \(\bar{W}^{\text{obs}}_0\) és la taxa de tractament observada per a aquells que no van ser encoratjats. \(\text{ITT}_W\) també es denomina de vegades la taxa d'absorció .
A continuació, l'efecte de l'estímul sobre el resultat es pot definir per a la persona \(i\) com:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
A més, aquesta quantitat es pot definir sobre tota la població com
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Finalment, podem estimar \(\text{ITT}_{Y}\) utilitzant dades:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
on \(\bar{Y}^{\text{obs}}_1\) és el resultat observat (per exemple, guanys) per a aquells que van ser encoratjats (per exemple, redactats) i \(\bar{W}^{\text{obs}}_0\) és el resultat observat per a aquells que no van ser encoratjats.
Finalment, fem referència a l'efecte d'interès: l'efecte del tractament primari (per exemple, el servei militar) sobre el resultat (per exemple, els guanys). Malauradament, resulta que no es pot, en general, estimar aquest efecte en totes les unitats. Tanmateix, amb algunes hipòtesis, els investigadors poden estimar l'efecte del tractament en els complimentaris (és a dir, les persones que serviran si es redacten i les persones que no serviran si no es redacten, taula 2.7). Vaig a cridar a aquesta estimació l' efecte causal mitjà complert (CACE) (que de vegades s'anomena efecte de tractament mitjà local , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
on \(G_i\) dona el grup de la persona \(i\) (vegeu la taula 2.7) i \(N_{\text{co}}\) és el nombre d'adjunts. En altres paraules, eq. 2,11 compara els guanys dels complients que estan redactats \(Y_i(1, W_i(1))\) i no redactat \(Y_i(0, W_i(0))\) . L'estimació en eq. 2.11 sembla difícil d'estimar a partir de les dades observades, ja que no és possible identificar els compatibles amb només les dades observades (per saber si algú és complert hauria d'observar si va servir quan va redactar i si va servir quan no es va redactar).
Resulta que, en certa manera, sorprenentment, que si hi ha compatibles, a continuació, sempre que es presenti tres suposicions addicionals, és possible estimar CACE a partir de les dades observades. En primer lloc, cal suposar que l'assignació al tractament és aleatòria. En el cas de la loteria, això és raonable. Tanmateix, en alguns entorns on els experiments naturals no es basen en l'aleatorització física, aquesta hipòtesi pot ser més problemàtica. En segon lloc, cal suposar que els seus no són defensors (aquesta suposició també es denomina de vegades el supòsit de monotonicitat). En el context del projecte sembla raonable suposar que hi ha molt poques persones que no serviran si són redactats i que serviran si no es redacten. Tercer i, finalment, ve la suposició més important que es denomina restricció d'exclusió . Sota la restricció d'exclusió, s'ha d'assumir que tot l'efecte de l'assignació de tractament es passa pel mateix tractament. En altres paraules, cal suposar que no hi ha cap efecte directe d'estímul en els resultats. En el cas del projecte de loteria, per exemple, cal suposar que aquest esborrany no té cap efecte sobre els guanys que no sigui el servei militar (figura 2.11). Es podria violar la restricció d'exclusió si, per exemple, les persones que van ser redactades passessin més temps a l'escola per tal d'evitar el servei o si els empleadors eren menys propensos a contractar persones que eren redactores.
Si es compleixen aquestes tres condicions (assignació aleatòria al tractament, no defiers i la restricció d'exclusió)
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
així que podem calcular CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Una manera de pensar sobre CACE és que és la diferència en els resultats entre els que van ser encoratjats i els que no es van animar, inflats per la taxa d'absorció.
Hi ha dues advertències importants per tenir en compte. En primer lloc, la restricció d'exclusió és un assumpte sòlid, i cal justificar-se, cas per cas, que sovint requereix coneixements sobre temes. La restricció d'exclusió no es pot justificar amb l'aleatorització de l'estímul. En segon lloc, un repte pràctic comú amb l'anàlisi instrumental variable prové quan l'estímul té poc efecte en l'absorció del tractament (quan \(\text{ITT}_W\) és petit). Això s'anomena instrument feble i condueix a una varietat de problemes (Imbens and Rosenbaum 2005; Murray 2006) . Una forma de pensar sobre el problema dels instruments dèbils és que \(\widehat{\text{CACE}}\) pot ser sensible a petits biaixos a \(\widehat{\text{ITT}_Y}\) -potencialment a causa de violacions de la restricció d'exclusió, perquè aquests biaixos s'amplien per un petit \(\widehat{\text{ITT}_W}\) (vegeu l'equació 2.13). Aproximadament, si el tractament que assigna la naturalesa no té un gran impacte en el tractament que us preocupa, llavors tindreu dificultats per aprendre el tractament que us preocupa.
Vegeu els capítols 23 i 24 d' Imbens and Rubin (2015) per obtenir una versió més formal d'aquesta discussió. L'enfocament economètric tradicional de les variables instrumentals s'expressa típicament en termes d'estimació d'equacions, no de resultats potencials. Per a una introducció des d'aquesta altra perspectiva, vegeu Angrist and Pischke (2009) , i per a una comparació entre els dos enfocaments, vegeu la secció 24.6 d' Imbens and Rubin (2015) . En el capítol 6 de Gerber and Green (2012) presenta una presentació alternativa, lleugerament menys formal de l'enfocament de variables instrumentals. Per obtenir més informació sobre la restricció d'exclusió, vegeu D. Jones (2015) . Aronow and Carnegie (2013) descriuen un conjunt addicional de suposicions que es poden utilitzar per estimar ATE en lloc de CACE. Per obtenir més informació sobre com els experiments naturals poden ser molt difícils d'interpretar, vegeu Sekhon and Titiunik (2012) . Per a una introducció més general als experiments naturals -una que va més enllà de l'enfocament de variables instrumentals- també inclouen dissenys com la discontinuïtat de la regressió, vegeu Dunning (2012) .