I dette vedlegget vil jeg oppsummere noen ideer om å gjøre årsakssammenheng fra ikke-eksperimentelle data i en litt mer matematisk form. Det er to hovedmetoder: kausalt graframme, mest forbundet med Judea Pearl og kolleger, og det potensielle rammevilkårene, mest forbundet med Donald Rubin og kolleger. Jeg vil introdusere potensielle rammebetingelser fordi det er nærmere knyttet til ideene i de matematiske notatene i slutten av kapittel 3 og 4. For mer om rammebetingelsene om Pearl, Glymour, and Jewell (2016) anbefaler jeg Pearl, Glymour, and Jewell (2016) (introduksjons ) og Pearl (2009) (avansert). For en boklengdsbehandling av årsakssammenheng som kombinerer potensielle rammevilkår og kausalt diagramramme, anbefaler jeg Morgan and Winship (2014) .
Målet med dette tillegget er å hjelpe deg med å bli komfortabel med notasjonen og stilen til den potensielle utfallstradisjonen, slik at du kan overgå til noen av de mer tekniske materialene som er skrevet om dette emnet. Først skal jeg beskrive potensielle rammevilkår. Da vil jeg bruke den til å diskutere naturlige eksperimenter som den av Angrist (1990) om effekten av militærtjenesten på inntjening. Dette vedlegget legger stor vekt på Imbens and Rubin (2015) .
Potensielt utfallsramme
Det potensielle rammen for utfallet har tre hovedelementer: enheter , behandlinger og potensielle utfall . For å illustrere disse elementene, la oss vurdere en stilisert versjon av spørsmålet adressert i Angrist (1990) : Hva er virkningen av militærtjeneste på inntjening? I dette tilfellet kan vi definere enhetene som er kvalifiserte til 1970-utkastet i USA, og vi kan indeksere disse menneskene ved \(i = 1, \ldots, N\) . Behandlingene i dette tilfellet kan være "tjene i militæret" eller "ikke tjene i militæret." Jeg vil kalle disse behandlings- og kontrollbetingelsene, og jeg skal skrive \(W_i = 1\) hvis personen \(i\) er i behandlingsbetingelsen og \(W_i = 0\) hvis personen \(i\) er i kontrolltilstanden. Til slutt er de potensielle utfallene litt mer konseptuelt vanskelige fordi de involverer "potensielle" utfall; ting som kunne ha skjedd. For hver person som er berettiget til utkastet til 1970, kan vi forestille seg det beløpet de ville ha tjent i 1978 hvis de tjente i militæret, som jeg vil ringe \(Y_i(1)\) , og beløpet de ville ha tjent i 1978 hvis de ikke tjente i militæret, som jeg vil ringe \(Y_i(0)\) . I det potensielle rammen for utfall er \(Y_i(1)\) og \(Y_i(0)\) betraktet faste mengder, mens \(W_i\) er en tilfeldig variabel.
Valget av enheter, behandlinger og utfall er kritisk fordi det definerer hva som kan og ikke kan læres av studien. Valget av enheter - personer som er kvalifisert for 1970-utkastet - inkluderer ikke kvinner, og uten tilleggsforutsetninger, vil denne studien ikke fortelle oss noe om effekten av militærtjeneste på kvinner. Beslutninger om hvordan man definerer behandlinger og utfall er også viktige. For eksempel bør behandlingen av interesse være fokusert på å tjene i militæret eller oppleve kamp? Skal utfallet av interesse være inntjening eller jobbtilfredshet? Til slutt bør valget av enheter, behandlinger og utfall drevet av studiens vitenskapelige og politiske mål.
Gitt valgene av enheter, behandlinger og potensielle utfall, er årsakseffekten av behandlingen på person \(i\) , \(\tau_i\) ,
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Med andre ord, sammenligner vi hvor mye person \(i\) ville ha tjent etter å ha tjent til hvor mye person \(i\) ville ha opptjent uten å tjene. For meg, eq. 2.1 er den klareste måten å definere en årsakssammenheng på, og selv om det er ekstremt enkelt, viser dette rammen seg å generaliseres på mange viktige og interessante måter (Imbens and Rubin 2015) .
Når jeg bruker det potensielle rammevilkårene, finner jeg det ofte å skrive ut et bord som viser de potensielle resultatene og behandlingseffekter for alle enheter (tabell 2.5). Hvis du ikke kan forestille deg et bord som dette for studiet ditt, må du kanskje være mer presis i definisjonene av enhetene, behandlingene og potensielle utfall.
Person | Inntekter i behandlingsbetingelser | Inntekter i kontrolltilstand | Behandlingseffekt |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Mener | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Når vi definerer årsakseffekten på denne måten, løper vi imidlertid inn i et problem. I nesten alle tilfeller får vi ikke observere begge potensielle utfall. Det vil si at en bestemt person enten serverte eller ikke tjente. Derfor observerer vi et av de potensielle resultatene - \(Y_i(1)\) eller \(Y_i(0)\) - men ikke begge. Manglende evne til å observere begge potensielle utfall er et så stort problem at Holland (1986) kalte det grunnleggende problemet med årsakssammenheng .
Heldigvis, når vi forsker, har vi ikke bare en person; heller, vi har mange mennesker, og dette gir en vei rundt det grunnleggende problemet med årsakssammenheng. I stedet for å forsøke å estimere behandlingseffekten på individnivå, kan vi estimere gjennomsnittlig behandlingseffekt for alle enheter:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Denne ligningen er fremdeles uttrykt i forhold til \(\tau_i\) , som ikke kan observeres, men med noe algebra (eq 2.8 av Gerber and Green (2012) ) får vi
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Dette viser at hvis vi kan anslå populasjons gjennomsnittlig utfall under behandling ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) og populasjons gjennomsnittlig utfall under kontroll ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) , da kan vi estimere gjennomsnittlig behandlingseffekt, selv uten å estimere behandlingseffekten for en bestemt person.
Nå som jeg har definert vår estimat - den tingen vi prøver å estimere - jeg snakker om hvordan vi faktisk kan estimere det med data. Og her løper vi direkte inn i problemet at vi bare observerer et av de potensielle resultatene for hver person; vi ser enten \(Y_i(0)\) eller \(Y_i(1)\) (tabell 2.6). Vi kunne estimere gjennomsnittlig behandlingseffekt ved å sammenligne inntektene til personer som tjente til inntektene til personer som ikke hadde tjent:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
hvor \(N_t\) og \(N_c\) er antall personer i behandlings- og kontrollforholdene. Denne tilnærmingen vil fungere bra hvis behandlingsoppgaven er uavhengig av potensielle utfall, en tilstand som iblant kalles ignorabilitet . Dessverre, i fravær av et eksperiment, er ignorabilitet ikke ofte tilfredsstilt, noe som betyr at estimatoren i ekv. 2.4 er ikke sannsynlig å produsere godt estimat. En måte å tenke på er at i fravær av tilfeldig tildeling av behandling, eq. 2,4 sammenligner ikke like med like; det er å sammenligne inntektene til ulike typer mennesker. Eller uttrykt litt annerledes, uten tilfeldig tildeling av behandling, er behandlingsallokasjonen trolig knyttet til potensielle utfall.
I kapittel 4 skal jeg beskrive hvordan randomiserte kontrollerte eksperimenter kan hjelpe forskere med årsakssammenheng, og her beskriver jeg hvordan forskere kan dra nytte av naturlige eksperimenter, for eksempel utkastet til lotteri.
Person | Inntekter i behandlingsbetingelser | Inntekter i kontrolltilstand | Behandlingseffekt |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Mener | ? | ? | ? |
Naturlige eksperimenter
En tilnærming til å lage kausal estimater uten å kjøre et eksperiment er å se etter noe som skjer i verden som tilfeldigvis har tildelt en behandling for deg. Denne tilnærmingen kalles naturlige eksperimenter . I mange situasjoner leverer naturligvis ikke tilfeldig den behandlingen du vil interessere befolkningen. Men noen ganger lever naturen tilfeldig en relatert behandling. Spesielt skal jeg vurdere saken der det er noen sekundær behandling som oppfordrer folk til å motta den primære behandlingen . For eksempel kan utkastet betraktes som en tilfeldig tilordnet sekundær behandling som oppfordret noen til å ta den primære behandlingen, som tjente i militæret. Denne utformingen kalles noen ganger en oppfordringsdesign . Og analysemetoden som jeg skal beskrive for å håndtere denne situasjonen kalles noen ganger instrumentelle variabler . I denne innstillingen, med enkelte antagelser, kan forskere bruke oppmuntringen til å lære om effekten av den primære behandlingen for en bestemt delmengde av enheter.
For å kunne håndtere de to ulike behandlingene - oppmuntringen og den primære behandlingen - trenger vi litt ny notasjon. Anta at noen mennesker er tilfeldig utarbeidet ( \(Z_i = 1\) ) eller ikke utarbeidet ( \(Z_i = 0\) ); I denne situasjonen kalles \(Z_i\) noen ganger et instrument .
Blant de som ble utarbeidet, tjente noen ( \(Z_i = 1, W_i = 1\) ) og noen gjorde ikke ( \(Z_i = 1, W_i = 0\) ). På samme måte, blant de som ikke var utarbeidet, tjente noen ( \(Z_i = 0, W_i = 1\) ) og noen gjorde ikke ( \(Z_i = 0, W_i = 0\) ). De potensielle utfallene for hver person kan nå utvides for å vise status for både oppmuntring og behandling. For eksempel, la \(Y(1, W_i(1))\) være inntjeningen til person \(i\) hvis han ble utarbeidet, der \(W_i(1)\) er hans servicestatus hvis utarbeidet. Videre kan vi dele befolkningen inn i fire grupper: komplikatorer, ikke-takers, defiers og alltid-takers (tabell 2.7).
Type | Service hvis utarbeidet | Service hvis ikke utarbeidet |
---|---|---|
comp | Ja, \(W_i(Z_i=1) = 1\) | Nei, \(W_i(Z_i=0) = 0\) |
Never-takers | Nei, \(W_i(Z_i=1) = 0\) | Nei, \(W_i(Z_i=0) = 0\) |
Defiers | Nei, \(W_i(Z_i=1) = 0\) | Ja, \(W_i(Z_i=0) = 1\) |
Alltid-takers | Ja, \(W_i(Z_i=1) = 1\) | Ja, \(W_i(Z_i=0) = 1\) |
Før vi diskuterer estimeringen av effekten av behandlingen (dvs. militærtjenesten), kan vi først definere to effekter av oppmuntringen (dvs. utarbeidet). For det første kan vi definere effekten av oppmuntringen på den primære behandlingen. For det andre kan vi definere effekten av oppmuntringen på utfallet. Det vil vise seg at disse to effektene kan kombineres for å gi et estimat av effekten av behandlingen på en bestemt gruppe mennesker.
For det første kan effekten av oppmuntring på behandling defineres for person \(i\) som
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Videre kan denne mengden defineres over hele befolkningen som
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Til slutt kan vi estimere \(\text{ITT} _{W}\) ved hjelp av data:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
hvor \(\bar{W}^{\text{obs}}_1\) er den observerte behandlingshastigheten for de som ble oppfordret, og \(\bar{W}^{\text{obs}}_0\) er Den observerte behandlingshastigheten for de som ikke ble oppmuntret. \(\text{ITT}_W\) kalles også noen ganger opptaksraten .
Deretter kan effekten av oppmuntring på utfallet defineres for person \(i\) som:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Videre kan denne mengden defineres over hele befolkningen som
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Til slutt kan vi estimere \(\text{ITT}_{Y}\) ved hjelp av data:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
hvor \(\bar{Y}^{\text{obs}}_1\) er det observerte resultatet (f.eks. inntjening) for de som ble oppmuntret (f.eks. utarbeidet) og \(\bar{W}^{\text{obs}}_0\) er det observerte resultatet for de som ikke ble oppmuntret.
Til slutt blir vi oppmerksom på effekten av interesse: effekten av den primære behandlingen (f.eks. Militærtjeneste) på utfallet (f.eks. Inntjening). Dessverre viser det seg at man generelt ikke kan estimere denne effekten på alle enheter. Imidlertid kan forskere med noen forutsetninger estimere effekten av behandlingen på komplikatorer (dvs. personer som vil tjene hvis utarbeidet og personer som ikke vil tjene hvis ikke utarbeidet, tabell 2.7). Jeg vil kalle dette estimatet til gjennomsnittlig årsakssammenheng (CACE) (som også kalles også den lokale gjennomsnittlige behandlingseffekten , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
hvor \(G_i\) donerer gruppen av person \(i\) (se tabell 2.7) og \(N_{\text{co}}\) er antall komplikatorer. Med andre ord, eq. 2.11 sammenligner inntektene til komplikatorer som er utarbeidet \(Y_i(1, W_i(1))\) og ikke utarbeidet \(Y_i(0, W_i(0))\) . Estimatet i eq. 2.11 synes vanskelig å estimere fra observerte data fordi det ikke er mulig å identifisere komplikatorer ved å bruke bare observerte data (for å vite om noen er kompliserer, må du observere om han tjente når han ble utarbeidet og om han tjente når han ikke ble utarbeidet).
Det viser seg - noe overraskende - at hvis det er noen komplikatorer, da det blir gitt en tre ytterligere antagelser, er det mulig å estimere CACE fra observerte data. Først må man anta at oppdraget til behandling er tilfeldig. I tilfelle av utkastet til lotteri er dette rimelig. Men i noen innstillinger der naturlige eksperimenter ikke stole på fysisk randomisering, kan denne antakelsen være mer problematisk. For det andre må man anta at de ikke er defiers (denne antagelsen kalles også noen ganger for monotonicitetsforutsetningen). I sammenheng med utkastet virker det rimelig å anta at det er svært få personer som ikke vil tjene hvis utarbeidet og vil tjene hvis ikke utarbeidet. Tredje, og til slutt, kommer den viktigste antakelsen som kalles ekskluderingsbegrensningen . Under utelukkelsesbegrensningen må man anta at all effekten av behandlingsoppdraget passerer gjennom selve behandlingen. Med andre ord må man anta at det ikke er direkte effekt av oppmuntring på resultatene. I tilfelle av utkastet til lotteri, for eksempel, må man anta at utkaststatus ikke har noen innvirkning på inntjening annet enn gjennom militærtjeneste (figur 2.11). Utelukkelsesbegrensningen kan bli overtrådt dersom for eksempel personer som ble utarbeidet, brukte mer tid på skolen for å unngå tjeneste, eller hvis arbeidsgivere var mindre tilbøyelige til å ansette folk som ble utarbeidet.
Hvis disse tre betingelsene (tilfeldig tildeling til behandling, ingen defiers, og ekskluderingsbegrensningen) er oppfylt, da
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
slik at vi kan estimere CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
En måte å tenke på CACE er at det er forskjellen i utfallet mellom de som ble oppmuntret og de som ikke var oppmuntret, oppblåst av opptaksraten.
Det er to viktige forbehold å huske på. For det første er ekskluderingsbegrensningen en sterk antagelse, og det må være berettiget fra tilfelle til sak, som ofte krever fagfaglig kompetanse. Utelukkelsesbegrensningen kan ikke begrunnes med randomisering av oppmuntringen. For det andre kommer en vanlig praktisk utfordring med instrumental variabel analyse når oppmuntringen har liten effekt på opptaket av behandling (når \(\text{ITT}_W\) er liten). Dette kalles et svakt instrument , og det fører til en rekke problemer (Imbens and Rosenbaum 2005; Murray 2006) . En måte å tenke på problemet med svake instrumenter er at \(\widehat{\text{CACE}}\) kan være følsomt for små forstyrrelser i \(\widehat{\text{ITT}_Y}\) -potensielt på grunn av brudd på ekskluderingsbegrensningen - fordi disse forspenningene forstørres av en liten \(\widehat{\text{ITT}_W}\) (se lik 2.13). Grovt, hvis den behandlingen som naturen tildeler, ikke har stor innvirkning på behandlingen du bryr deg om, vil du ha det vanskelig å lære om behandlingen du bryr deg om.
Se kapittel 23 og 24 i Imbens and Rubin (2015) for en mer formell versjon av denne diskusjonen. Den tradisjonelle økonometriske tilnærmingen til instrumentelle variabler uttrykkes typisk når det gjelder estimering av ligninger, ikke potensielle resultater. For en introduksjon fra dette andre perspektivet, se Angrist and Pischke (2009) , og for en sammenligning mellom de to tilnærmingene, se avsnitt 24.6 i Imbens and Rubin (2015) . En alternativ, litt mindre formell presentasjon av instrumentelle variabler tilnærming er gitt i kapittel 6 i Gerber and Green (2012) . For mer om ekskluderingsbegrensningen, se D. Jones (2015) . Aronow and Carnegie (2013) beskriver et ekstra sett antagelser som kan brukes til å estimere ATE i stedet for CACE. For mer om hvordan naturlige eksperimenter kan være svært vanskelig å tolke, se Sekhon and Titiunik (2012) . For en mer generell introduksjon til naturlige eksperimenter-en som går utover bare instrumentelle variablene tilnærming til også å inkludere design som regresjonsdiskontinuitet-se Dunning (2012) .