An dësem Appendix wäert ech e puer Ideen féieren iwwer Kausal Inference vu net-experimentelle Donnéeën an enger liicht méi mathematesch Form. Et sinn zwee Haaptkonzepter: de Kausalgrafskader, déi am meeschten mat Judea Pearl a Kollegen associéiert sinn, an de potentiel Resultater Kader, am meeschten mat Donald Rubin a Kollegen. Ech wäert den potenziellen Resultatkader virstellen, well se méi am Zesummenhang mat den Iddien an de mathemateschen Noten am Kapitel vum Kapitel 3 a 4 Pearl, Glymour, and Jewell (2016) . Fir méi iwwer de Kausalskriisen, empfänkt ech Pearl, Glymour, and Jewell (2016) ) an Pearl (2009) (erweidert). Fir eng livelange Behandlung vun de kosalesche Inferenzen, déi den potenziellen Resultatkader an de Kausalgrafskader kombinéiert, proposéiert ech Morgan and Winship (2014) .
Ziel vun dësem Appendix ass fir Iech ze bequem mam Notaire a Stil vun der potenzieller Resultater Traditioun ze maachen, sou datt Dir op e puer vun de méi techneschen Material op dësem Thema geschriwwe kënnt. Éischt wäert ech de potenziivt Resultatkader beschreiwen. Dann wäert ech et benotzen fir iwwer natirlech Experimenten wéi d'vum Angrist (1990) iwwer d'Effet vum militäresche Service iwwer e Gewënn ze diskutéieren. Dësen Appendix schéisst Schwieregkeeten op Imbens and Rubin (2015) .
Potential Resultater Frame
De potentielle Resultatkader huet dräi Haaptelementer: Eenheeten , Behandlungen a potenziellen Resultater . Fir dës Elementer ze illustréieren, lasst een eng styliséierter Versioun vun der Fro zu Angrist (1990) : Wat ass den Effet vum militäresche Service iwwer dem Akommes? An dësem Fall kënnen mir d' Eenheeten definéieren fir Leit ze kréien fir den 1970 Entworf an den USA ze kréien, a mir kënnen dës Leit mat Index markéieren \(i = 1, \ldots, N\) . D' Behandlungen an dësem Fall kënnen "an der Militärarchioun" oder "net am Militärdéngscht" sinn. Ech soen dës Behandlungs - a Kontrollskonditioune an ech schreiwen \(W_i = 1\) wann Persoun \(i\) ass an der Behandlungsbedingung a \(W_i = 0\) wann Persoun \(i\) an der Kontrollzuel steet. Endlech sinn d' Potenzialer Resultater méi konzeptuell schwiereg, well si "potenziell" Resultater beaflosst; Saachen déi kéint passéiert sinn. Fir all Persoun, déi fir den 1970 Entworf nohalteg ass, kënne mir de Betrag Iech virstellen, datt se 1978 am Joer verdéngt hätten, wann se an de Militär waren, déi ech \(Y_i(1)\) nennen, an de Betrag deen si verdéngt hätten 1978 wann se net am Militärdéngscht geduet hunn, wat ech da ruffe \(Y_i(0)\) . Am potenziivt Resultatkader sinn \(Y_i(1)\) a \(Y_i(0)\) als feste Quantitéiten betraff, während \(W_i\) eng Zufallsvariable ass.
D'Wiel vun den Unitéiten, Behandlungen a Resultater ass kritesch well se definéiert wat et kann - a kann net vun der Studie geléiert ginn. D'Wiel vun den Eenheeten - Leit, déi fir de 1970 Entworf fir matzemaachen - keng Fraën ophalen, an esou ouni awer weider Hypothesen, wäert dës Etude näischt soen iwwer den Effet vum militäresche Service iwwer Fraen. D'Décisiounen iwwer wéi d'Behandlungen an d'Resultate definéieren sinn wichteg. Zum Beispill, sollte d'Behandlungszomenter vum Interessi konzentréiert gi fir am Militärdengscht ze schaffen oder géint de Kampf? Sollt d'Resultat vum Interessi Gehalt oder Aarbecht zefridden? Lescht ass d'Auswiel vun Appartementen, Behandlungen a Resultater vun de wëssenschaftlechen a politesche Ziler vun der Studie.
A wat de Choix vun Eenheeten, Behandlungen a potenziellen Resultater ugeet, ass de kosalale Effekt vun der Behandlung vu Persoune \(i\) , \(\tau_i\)
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
An anere Wierder, mir vergläichen wéi vill Persoun \(i\) hätten verdéngt nodeem Dir dorunner gedéngt hätt wéi vill Persoun \(i\) hätten verdéngen ouni ze servéieren. Ech, eq. 2.1 ass dee kloregste Wee fir e kausalen Effekt ze definéieren, an obwuel extrem einfach ass, gëtt dëse Kader ëm vill an wichteg an interessant Manéier (Imbens and Rubin 2015) .
Wann Dir den potenziellen Resultatkader benotzt, häss ech oft vill méi hëllefe fir eng Tabell ze weisen déi d'potentiel Resultater an d'Behandlungseffects fir all Eenheeten (Tab. 2.5) ze weisen. Wann Dir net an engem Dësch kënnt virstellen fir Iech ze studéieren, da musst Dir méi genee an Ärer Definitioun vun Ären Unitéiten, Behandlungen a potenziellen Resultater méi präziséieren.
Persoun | Akommes am Behandlungszustands | Einnahme vun der Kontrollzouf | Behandlungseffekt |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Mëttelen | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Wann Dir de kausalen Effekt op dës Manéier definéiert, hu mir awer e Problem. An bal all Fäll wëlle mir keng potenziell Resultater beobachten. Dat ass eng spezifesch Persoun, déi entweder gedéngt oder net gedéngt huet. Dofir beobachten mir ee vun den potenziellen Resultater - \(Y_i(1)\) oder \(Y_i(0)\) - awer net zwee. D'Onméiglechkeet, souwuel potenziell Resultater ze beobachten, ass e grousst Problem, datt Holland (1986) et d' Grondproblematik vun der Ursachs-Inferenz nennt .
Glécklech, wann mir Recherchen maachen, hu mir net nëmmen eng Persoun; Mir sinn e puer Leit, an dat bitt e Wee iwwer d'fundamental Froe vun der Verwierklechung vun Infairen. Stéit, fir de Effekter vum Behandlungsoffall individuell ze schätzen, kënne mir den Duerchschnëttsvirgang fir all Unitéiten schätzen:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Dës Gläichung gëtt ëmmer ausgedréckt an d' \(\tau_i\) , déi net beobachtbar sinn, mee mat enger Algebra (Gl. 2,8 vun Gerber and Green (2012) ) kritt
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Dëst weist datt wann een de Bevëlkerungsduerchgang Resultat ënnert der Behandlung schätzen kann ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) an de Bevëlkerungsduerchgang ënner Kontroll ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), da kënne mir den Duerchschnëtt behandelen Effekt, och ouni Schätzung vun der Behandlungseffect fir eng besonnesch Persoun.
Elo, datt ech eis Schätz doriwwer definéiert huet - dat wat mir versicht schätzen - ech sinn erëm wéi mir et mat Daten schätzen. An da lafe mir direkt an de Problem datt mer nëmmen eng vun den potenziellen Resultater fir all Persoun beobachten; Mir gesinn entweder \(Y_i(0)\) oder \(Y_i(1)\) (Tabelle 2.6). Mir konnten de Duerchschnëtt behandelen Effekt duerch de Verglach vun de Gewënn vun de Leit, déi dem Gewënn vun Persounen, déi net déngen hunn,
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
wou \(N_t\) a \(N_c\) d'Zuel vu Leit an de Behandlungs- a Kontrollbedingunge sinn. Dëse Konzept funktionnéiert gutt, wann d'Behandlungsuerdnung onofhängeg vu potenziellen Resultater ass, eng Bedingung, déi heiansdo d' Ongëssbarkeet genannt gëtt . Leider, am Fong vun engem Experiment, d'Ignoranz ass net oft zefridden, dat heescht datt de Schätzer an eq. 2.4 ass net wahrscheinlech e gudde Schätz. Ee Wee fir iwwer dat ze denken ass datt wann et keng zoufälleg Aufgab vun der Behandlung ass, eq. 2.4 ass net vergläicht mat ähnlechen; et ass de Verglach vun de Gewënn vun verschiddenen Persounen. Oder huet sech liicht ënnerschriwwen, ouni Zufallsausgab vun der Behandlung, ass d'Behandlung Zuteilung wahrscheinlech mat potenziellen Resultater.
Am Kapitel 4 gëtt ech beschriwwen, wéi randoméiert kontrolléiert Experimenter kënnen d'Fuerscher hëllefe kosiale Schätzungen maachen an et wäert ech beschreiwe wéi d'Fuerscher d'Natur vun den Experimenten benotzen, wéi zum Beispill de Lotterie.
Persoun | Akommes am Behandlungszustands | Einnahme vun der Kontrollzouf | Behandlungseffekt |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Mëttelen | ? | ? | ? |
Natierlech Experimenter
Eng Approche fir Kausalschätzungen ze maachen ouni ouni Experiment ze maachen, ass eppes wat an der Welt geschitt ass, déi onbedéngt eng Behandlung fir Iech huet. Dës Approche ginn natirlech Experimenter genannt . A ville Situatiounen, leider ass d'Natur net zoufälleg déi Behandlung, déi Dir fir d'Interessi vun der Bevëlkerung wëllt interesséieren. Mee heiansdo gëtt d'Natur zoufälleg eng reliant Behandlung. Insbesondere wäerte mir de Fall leeën, wou et eng sekundär Behandlung ass, déi d'Leit erméiglecht, d' Grondbehandlung ze kréien . Zum Beispill konnt de Projet als zufallsvergëftlech sekundär Behandlung behandelt ginn, déi e puer Leit erméiglecht huet d'Primärbehandlung ze huelen, déi am Militärdéngscht war. Dëse Design gëtt heiansdo als Ermëttlungsdesign genannt . An déi Analysemethod déi ech beschreiwen fir dës Situatioun ze behandelen, gëtt heiansdo instrumental Variablen genannt . An dëser Ëmfeld, mat e puer Annuaire, kënnen d'Fuerscher d'Ermëttlung benotzen fir iwwer den Effekt vun der Grondbehandlung fir eng speziell Ënnergrupp vun Unitéiten ze léieren.
Fir déi zwee ënnerschiddlech Behandlungen ze handhaben - d'Ermëttlung an d'Grondbehandlung - brauche mir eng nei Notioun. Stellt Iech vir, datt verschidde Leit zoufälleg virgesi sinn ( \(Z_i = 1\) ) oder net opgemaach ( \(Z_i = 0\) ); an dëser Situatioun \(Z_i\) ass heiansdo een Instrument gebraucht .
Ënnert denen, déi entworf goufen, waren a verschiddene ( \(Z_i = 1, W_i = 1\) ) an e puer net ( \(Z_i = 1, W_i = 0\) ). An och déi, déi net opgefouert goufen, hunn e puer \(Z_i = 0, W_i = 1\) ( \(Z_i = 0, W_i = 1\) ) an e puer huet net ( \(Z_i = 0, W_i = 0\) ). D'potentiel Resultater fir all Persoun kënnen elo erweidert ginn fir hir Status fir d'Ermëttlung an d'Behandlung ze weisen. Zum Beispill, loosse \(Y(1, W_i(1))\) ginn d'Akommes vun Persoun \(i\) wann hien COSL war, wou \(W_i(1)\) ass säi Service Status wann COSL. Mir kënnen d'Bevëlkerung an véier Gruppen trennen: Vollzäitaarbechter, Nofolger, Defiziter a ëmmer Alarmnéierer (Tabelle 2.7).
Typ | Service wann e schafft | Service wann net erofgeschafft gouf |
---|---|---|
Komplett | Jo, \(W_i(Z_i=1) = 1\) | Nee, \(W_i(Z_i=0) = 0\) |
Nie-Nout | Nee, \(W_i(Z_i=1) = 0\) | Nee, \(W_i(Z_i=0) = 0\) |
Defiers | Nee, \(W_i(Z_i=1) = 0\) | Jo, \(W_i(Z_i=0) = 1\) |
Always-Noperen | Jo, \(W_i(Z_i=1) = 1\) | Jo, \(W_i(Z_i=0) = 1\) |
Niewt mir diskutéieren d'Schätzung vum Effekt vun der Behandlung (dh Militärdéngscht) ze diskutéieren, kënne mir ufanks zwee Effekter vun der Ermëttlung definéieren (dh ausgeschafft). Als éischt, kënne mir den Effekt vun der Ermëttlung vum primäre Behandele definéieren. Zweetens, mir kënnen den Effet vun der Ermëttlung vum Resultat festleet. Et wäert erëmfannen datt dës zwee Effekter kombinéiert ginn fir eng Schätzung vum Effekt vun der Behandlung op enger spezifescher Grupp vu Leit ze proposéieren.
Éischtens kann den Effekt vun der Ermëttlung vun der Behandlung fir Persoun \(i\) als definéiert ginn
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Weider ass dës Quantitéit iwwer d'ganz Bevëlkerung wéi
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Endlech kënne mir \(\text{ITT} _{W}\)
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
wou \(\bar{W}^{\text{obs}}_1\) ass de beobachtete Geschwindegkeetsgrad fir déi, déi encouragéiert goufen, a \(\bar{W}^{\text{obs}}_0\) déi beobachtter Tariffer vun der Behandlung fir déi déi net encouragéiert goufen. \(\text{ITT}_W\) ass och heiansdo den Aufnahmegespréich .
Als nächst kënnt den Effet vun der Ermëttlung vum Resultat fir Persoun \(i\) wéi:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Weider ass dës Quantitéit iwwer d'ganz Bevëlkerung wéi
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Endlech kënne mir schreiwen \(\text{ITT}_{Y}\) Daten benotzen:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
wou \(\bar{Y}^{\text{obs}}_1\) \(\bar{W}^{\text{obs}}_0\) ass déi beobachtete Resultat fir déi, déi net ënnerstëtzt goufen.
Endlech wëlle mir d'Opmierksamkeet op den Effet vum Interessi: den Effekt vun der Grondbehandlung (z. B. vum militäreschen Déngscht) iwwert d'Resultater (z. B. Gewënn). Leider weess et, datt een net allgemeng Schätzungen op all Unitéiten schätzt. Allerdéngs, mat enger Hypothesen, kënnen d'Fuerscher den Effekt vun der Behandlungsplattform schätzen (dh Leit, déi wann Dir geschafft hutt an Leit déi net déngen zielen wann net opgemaach ass, Tabelle 2.7). Ech wäert dat Schockela soen den komplette Mose kausal Effekt (CACE) (dat och heiansdo den lokalen Duerchschnëtts-Behandlungseffekt , LATE genannt gëtt):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
wou \(G_i\) spillt d'Grupp vu Persounen \(i\) (kuckt Tabelle 2.7) an \(N_{\text{co}}\) ass d'Zuel vu Komplexisten. An anere Wierder, eq. 2.11 vergläicht d'Akommes vu Komplexisten, déi opgemaach sinn \(Y_i(1, W_i(1))\) a net entwéckelt \(Y_i(0, W_i(0))\) . D'Schätzung zu Ä. 2.11 schéngt schwiereg ze befaassen aus beobachtete Donnéeën, well et net méiglech Leit ze identifizéieren, déi nëmmen beobachtete Donnéeën benotzen (fir ze wëssen ob een et komplizéiert misst Dir observéieren, ob hien beim Entworf gedréckt huet oder ob hien gedréckt gëtt wann net geschafft ginn ass).
Et gëtt vill iwwerraschend - datt wann et engem komplizéiert sinn, da gëtt et dräi extra Hypothesen, et ass méiglech, d'CACE aus observéierte Donnéeën ze schätzen. Eischtens muss een huelen datt d'Attributatioun fir d'Behandlung zoufälleg ass. Am Fall vun der Lotto gäeren ass et vernoléisseg. Awer a wéineg Astellungen, wou natirlech Experimenter net op physesch Zirkulatioun baséiert, kann dës Virgann méi Problematik sinn. Zweetens muss een huelen datt se keng Defiziter sinn (dës Iwwernahmung gëtt och heiansdo d'Monotonizitéit gehalen). Am Kontext vum Entworf ass et vernoléissbar ze iwwerzeegen, datt et ganz wéineg Leit gëtt, déi net wann et geschafft gëtt a gitt wann si net entworf ginn. Drëttens, a schliisslech, ass déi wichtegst Iddi, déi d' Exklusiounsbeschränkung genannt gëtt . Ënner der Exklusiounsbeschränkung muss een huelen datt all den Effekt vun der Behandlung ass vun der Behandlung selwer geleet gëtt. An anere Wierder, muss een huelen, datt et keen direkten Effekt vun der Ermëttlung vum Resultat gëtt. Am Fall vun der Lotto unzeleeën, muss et ugeholl datt den Entwuerungsstatus keen Effekt op e Gewiichtsverloscht huet wéi iwwer Militärdéngscht (Zuel 2.11). D'Ausgrenzungsbeschränkung kéint géife verstoppt ginn, wann zum Beispill Leit sinn, déi méi Zäit an der Schoul gemaach hunn, fir ze vermeiden oder wann d'Patronen manner Chancen hunn fir Leit ze léinen, déi geschafft hunn.
Wann dës dräi Conditioune (Zoufall zu Behandlungen, keng Defiziter, an d'Ausgrenzungsbeschränkung) erfëllt ginn, dann
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
also kënne mir CACE schätzen:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Een Wee fir iwwer CACE ze denken ass datt et den Ënnerscheed tëscht den Resultater tëscht deenen déi encouragéiert goufen an déi déi net encouragéiert goufen, opgeriicht vu der Aufnahmegeschwindigkeit.
Et ginn zwee wichteg Opbehalten, déi am Aen zouloossen. Als éischt ass d'Exclusiounsbeschränkung eng staark Iwwerhellegung an et muss gerechtfäerdegt sinn op Basis vu Fallbeispiele. D'Ausgrenzungsbeschränkung kann net mat der Zäiptradéierung vun der Ermëttlung gerechtfäerdegt ginn. Zweetens ass eng gemeinsam praktesch Erausfuerderung mat instrumental variabler Analyse, wann d'Ermëttlung guer keng Auswierkung op d'Behuele vun der Behandlung ass (wann \(\text{ITT}_W\) ass kleng). Dëst gëtt als schwaach Instrument bezeechent an et féiert zu villen Probleemer (Imbens and Rosenbaum 2005; Murray 2006) . Ee Wee fir iwwer d'Schwieregkeeten mat der Schwieregkeeten ze denken ass datt \(\widehat{\text{CACE}}\) kann empfindlech sinn op kleng Lycéen an \(\widehat{\text{ITT}_Y}\) -potentiell wéinst der Verstouss géint d'Exklusiounsbeschränkung - well dës Biasis vergréissert gëtt duerch e klenge \(\widehat{\text{ITT}_W}\) (kucke eq 2.13). A wann iwwerhaapt, wann d'Behandlung déi d'Natur asetzt, net eng grouss Auswierkung op d'Behandlung déi Dir Iech interesséiert, da sidd Dir eng schwéier Zäit léieren iwwer d'Behandlung déi Dir Iech interesséiert.
Kuck am Kapitel 23 an 24 vun Imbens and Rubin (2015) fir eng méi formell Versioun vun dëser Diskussioun. D'traditionell ökonometresch Approche fir instrumental Variablen gëtt normalerweis ausgedréckt an d'Schätzung vu Gleichungen, net potenziell Resultater. Fir eng Aféierung vun dëser anerer Perspektiv gesinn, kuckt Angrist and Pischke (2009) , a fir e Verglach tëscht den zwou Approche, kucke Sektioun Imbens and Rubin (2015) vun Imbens and Rubin (2015) . Eng Alternativ, e bësse manner formell Presentatioun vun den Instrumentalvariablen Approche gëtt am Kapitel 6 vun Gerber and Green (2012) versuergt. Fir méi iwwer d'Exclusiounsbeschränkung, kuckt D. Jones (2015) . Aronow and Carnegie (2013) beschreift en zousätzleche Set vun Annuaire, déi benotzt kënne fir ATE anstatt CACE ze schätzen. Fir méi wéi d'natierlech Experimenter ganz schwéier sinn ze interpretéieren, kuckt Sekhon and Titiunik (2012) . Fir eng méi allgemenge Einféierung vun den natierleche Experimenten, déi iwwer d'Instrumentalvariablen erausgaange sinn, kommen och Konzepter wéi Regressiounsstopp ze gesinn - kuck Dunning (2012) .