Yn dizze oanfolling sil ik guon ideeën oergean oer it meitsjen fan kausale ynfetsje fan net-eksperiminteel gegevens yn in wat mear matematyske foarm. Der binne twa wichtige oanwêzigen: it kausale grafykramt, meast ferbûn mei Judea Pearl en kollega's, en it potinsjele útkomsteskema, meast ferbûn mei Donald Rubin en kollega's. Ik sil it potinsjele útslachramt ynstelle, om't it mear lid fan 'e ideeën yn' e wiskunde is oan 'e ein fan haadstik 3 en 4 ferbûn. Foar mear oer it kausaal grafyk ramt ik oan Pearl, Glymour, and Jewell (2016) ) en Pearl (2009) (Avansearre). Foar in boeklange behanneling fan kausalske ynterferinsje dy't it potinsjele ramt fan it potinsjeel en it kausaal grafykramt kombinearret, advisearje ik Morgan and Winship (2014) .
It doel fan dizze taheaksel is om te helpen dat jo noflik binne mei de notaasje en styl fan 'e potensjele útkomst-tradysje, sadat jo oergean kinne op guon fan it mear technyske materiaal op dit ûnderwerp skreaun. Earst sil ik it potinsjele útkomsteskema beskriuwe. Dan sil ik it brûke om fierdere natuerlike eksperiminten te besprekjen lykas de troch Angrist (1990) oer it effekt fan militêre tsjinst op earnings. Dizze appendyk lûkt swier op Imbens and Rubin (2015) .
Potinsjeel resultaten ramt
It potinsjele rinnende ramt hat trije wichtige eleminten: ienheden , behannelingen en potinsjele resultaten . Om dizze eleminten te yllustrearjen, lit ús in stylisearre ferzje fan 'e fraach behannele yn' e Angrist (1990) : Wat is it effekt fan militêre tsjinst op betelingen? Yn dit gefal kinne wy de ienheden befetsje foar minsken dy't yn 'e Feriene Steaten yn' t rjocht komme kinne foar it ûntwerp fan 'e 1970, en wy kinne dizze minsken yndeksje troch \(i = 1, \ldots, N\) . De behannelingen yn dit gefal kinne "tsjinst yn it militêr" of "net tsjinje yn it militêr". Ik neam dizze betingsten foar behanneling en kontrôle, en ik sil \(W_i = 1\) as persoan \(i\) is yn 't behannele kondysje en \(W_i = 0\) as persoan \(i\) yn' e \(W_i = 0\) . Uteinlik binne de potinsjele resultaten noch wat konceptuële dreech omdat se "potensjele" resultaten beynfloedzje; dingen dy't it barre kinne. Foar elke persoan dy't yn oanmerking foar it ûntwerp fan 'e 1970 is, kinne wy it bedrach jouwe dat se yn 1978 fertsjinne wiene as se tsjinne yn it militêr, dat ik neame \(Y_i(1)\) en it bedrach dat se yn 1978 as se net tsjinje yn it militêr, dat ik neame \(Y_i(0)\) . Yn it potinsjele útkomsteskema wurde \(Y_i(1)\) en \(Y_i(0)\) as fêste groepen beskôge, wylst \(W_i\) in willekeurige fariabele is.
De kar foar ienheden, behannelingen en resultaten is kritysk, om't it beskiedt wat kin en kin net leard wurde fan 'e stúdzje. De keuze fan ienheden foar minsken dy't yn oanmerking komme foar it 1970 ûntwerp, hawwe gjin froulju, en sa sûnder ekstra oanfragen, sil dit stúdzje ús neat fertelle oer it effekt fan militêre tsjinst op froulju. Besluten oer it bepalen fan behannelingen en resultaten binne ek wichtich. Bygelyks moat de behanneling fan belang rjochte wêze op tsjinjen yn 'e militêre of ûnderfining fan' e striid? Is it resultaat fan belang fertsjintwurdiging of funksjefeardigens? Uteinlik moat de kar foar ienheden, behannelingen en resultaten troch de wittenskiplike en beliedsdoelen fan 'e stúdzje riden wurde.
Mei it each op de karren fan ienheden, behannelingen en potinsjele resultaten, is it kausale effekt fan 'e behanneling oer persoan \(i\) , \(\tau_i\) ,
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Mei oare wurden fergelykje wy hoefolle persoan \(i\) fertsjinwurdige hawwe soe nei't jo tsjinje hoefolle persoan \(i\) fertsjinje soe sûnder tsjinjen. Foar my, eq. 2.1 is de dúdlikste manier om in kausal effekt te bepalen, en hoewol ienfâldich ienfâldich, dit ramt feroaret yn algemien wichtige en nijsgjirrige wizen werom (Imbens and Rubin 2015) .
By it brûken fan it potinsjele útkomstpatroam, haw ik faak it nuttich te finen om in tabel te skriuwen dy't de potensjele resultaten en de behannele effekten foar alle ienheden sjen lit (tabel 2.5). As jo net in tabel hjirfoar foar jo stúdzje kinne foarstelle, dan kinne jo miskien mear prate moatte yn jo definysjes fan jo ienheden, behannelingen en potinsjele resultaten.
Persoan | Earnings yn behanneling | Earnings yn kontrôlemoat | Behandelingseffekt |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Betsjutte | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
By it definiearjen fan 'e oarsaakske effekt op dizze manier lykwols rinne wy yn in probleem. Yn hast alle gefallen krije wy gjin potinsjele resultaten. Dat is in spesifike persoan of tsjinne of net tsjinst. Dêrom sjogge wy ien fan 'e potinsjele resultaten- \(Y_i(1)\) of \(Y_i(0)\) -niet net beide. De ûnfermogen om sawol potinsjele útkomsten te beoardieljen is sa'n grutte probleem dat Holland (1986) it Fûnemintaalprobleem fan 'e Causal Inference neamde.
Gelokkich, as wy ûndersyks dwaan, hawwe wy net allinich ien persoan; Leaver hawwe wy in protte minsken, en dit biedt in manier om it Fûnemintale probleem fan 'e koartsjinst. Yn stee fan it probearjen fan 'e behannelingseffekt fan' e ynderlik nivo, kinne wy de gemiddelde behannelingseffekt foar alle ynrjochting bepale:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Dizze lykwicht wurdt noch altyd útdrukt yn 'e \(\tau_i\) , dy't ûnsichtber binne, mar mei wat algebra (ek 2.8 fan Gerber and Green (2012) ) krije wy
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Dit soarget dat as wy de befolking yndividuele útkomsten kinne beskiede troch behanneling ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) en de befolking trochsnee útkomst ûnder kontrôle ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), dan kinne wy de gemiddelde behanneling effektje, sels sûnder de behannelingseffekt foar in bepaalde persoan te beskachten.
No, dat ik ús skatting definieare - it ding dat wy besykje te meitsjen-ik werklikje hoe't wy dat kinne mei de gegevens te fertsjinjen. En hjir rinne wy direkt yn it probleem dat wy allinich ien fan 'e potinsjele útkomsten foar elke persoan bepale; Wy sjogge ek \(Y_i(0)\) of \(Y_i(1)\) (tabel 2.6). Wy kinne de gemiddelde behanneling effektje troch te fergelykjen fan de fertsjinsten fan minsken dy't dienen oan it fertsjinjen fan minsken dy't net tsjinje:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
wêr \(N_t\) en \(N_c\) binne de nûmers fan minsken yn 'e behanneling en kontrôle. Dizze oanpak sil goed wurkje as de behannelingsyndieling ûnôfhinklik is fan potensjele resultaten, in betingst dat wolris ûngeduld neamd wurdt . Spitigernôch, yn 'e ûntploai fan in eksperimint, ûnwittens is net faak tefreden, wat betsjut dat de skattator yn eq. 2.4 is net wierskynlik in goede tarieding te meitsjen. Ien manier om it te tinken is dat yn 't gefang fan willekeurige opdracht fan behanneling, eq. 2.4 is net te fergelykjen mei as like; It fergelykt it fertsjinjen fan ferskate soarten minsken. Of wat oars ekspresjearre, sûnder willekeurige oanbelangjende behanneling, de behanneling wurde allegearre relatearre oan potinsjele resultaten.
Yn haadstik 4 sil ik beskriuwe hoe't randomisearre kontrolearjende eksperiminten helpe kinne ûndersikers bywurke kausale skatten, en hjir sil ik beskriuwe hoe't ûndersikers de foardielen fan natuerlike eksperiminten brûke kinne, lykas it draaiboek.
Persoan | Earnings yn behanneling | Earnings yn kontrôlemoat | Behandelingseffekt |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Betsjutte | ? | ? | ? |
Natuer eksperiminten
Ien oanpak foar it meitsjen fan kausale skatten sûnder in eksperimint te meitsjen is om nei wat te finen yn 'e wrâld dy't in behanneling foar jo hat. Dizze oanpak hjit natuerlike eksperiminten . Yn in protte situaasjes liedt de natuer net de wjersidichheid fan 'e behanneling dat jo de befolking fan belang wolle wolle. Mar somtiden learet de natuer in relatearre behanneling. Yn it bysûnder, ik sille de saak beskôgje wêr't in pear sekundêre behanneling is dy't minsken stimulearret om de primêre behanneling te krijen . Bygelyks, it ûntwerp kin beskôge wurde as in willekeurige oanbelangjende sekundêre behanneling dy't inkele minsken stimulearre om de primêre behanneling te nimmen, dy't yn 'e militêre tsjinje betsjutte. Dit ûntwerp wurdt soms in stimulearjend ûntwerp neamd . En de analyzing metoade dy't ik beskriuwje om dizze situaasje te behanneljen wurdt soms in ynstrumintale fariabelen neamd . Yn dizze ynstelling, mei guon oanfragen, kinne ûndersikers it stimulearje brûke om te learen oer it effekt fan 'e primêre behanneling foar in bepaalde subset fan ienheden.
Om de twa ferskillende behannelingen te behanneljen - de stimulearring en de primêre behanneling - wy moatte in oantal nije notysjes nedich hawwe. Tink derom dat guon minsken willekeurich tekene wurde ( \(Z_i = 1\) ) of net opsteld ( \(Z_i = 0\) ); Yn dizze situaasje wurdt \(Z_i\) soms in ynstrumint neamd .
Under dyjingen dy't opsteld waarden, waarden guon tsjinne ( \(Z_i = 1, W_i = 1\) ) en guon die net ( \(Z_i = 1, W_i = 0\) ). Likewis, ûnder dejingen dy't net opnommen waarden, tsjinne guon ( \(Z_i = 0, W_i = 1\) ) en guon die net ( \(Z_i = 0, W_i = 0\) ). De potinsjele resultaten foar elke persoan kinne no útwreide wurde om har status foar sawol de stimulearring en de behanneling te sjen. Lykwols, lit \(Y(1, W_i(1))\) de fertsjinsten fan persoan \(i\) as er útsteld is, dêr't \(W_i(1)\) syn tsjinststatus is as it is ûntwerp. Fierder kinne wy de befolking yn fjouwer groepen splitte: kompleksjes, nea-takers, defiers, en altyd-takers (tabel 2.7).
Type | Tsjinst as ôfwurke | Tsjinst as net opsteld is |
---|---|---|
Compliers | Ja, \(W_i(Z_i=1) = 1\) | Nee, \(W_i(Z_i=0) = 0\) |
Nea-takers | Nee, \(W_i(Z_i=1) = 0\) | Nee, \(W_i(Z_i=0) = 0\) |
Defiers | Nee, \(W_i(Z_i=1) = 0\) | Ja, \(W_i(Z_i=0) = 1\) |
Always-takers | Ja, \(W_i(Z_i=1) = 1\) | Ja, \(W_i(Z_i=0) = 1\) |
Foardat wy besjogge hoe't it effekt fan 'e behanneling (sa as militêre tsjinst) beoardielje kin, kinne wy foar elke twa effekten fan' e stimulearje (krekt as ynsteld) bepale. Earst kinne wy it effekt fan 'e stimulearje op' e primêre behanneling definiearje. Twadder kinne wy de effekt fan 'e stimulearje op' e útkomst bepale. It sil útkomme dat dizze twa effekten kombinearje kinne om in skatting te jaan foar it effekt fan de behanneling op in spesifike groep minsken.
Earst kin it effekt fan de stimulearring op behanneling definieare wurde foar persoan \(i\) as
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Fierder kin dizze kwantiteit definieare wurde oer de hiele befolking as
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Uteinlik kinne wy skatte \(\text{ITT} _{W}\) gebrûk fan gegevens:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
wêr \(\bar{W}^{\text{obs}}_1\) is de beoardieling fan behanneling foar dyjingen dy't stimulearre binne en \(\bar{W}^{\text{obs}}_0\) de beoardielde taryf fan behanneling foar dyjingen dy't net stimulearre waarden. \(\text{ITT}_W\) wurdt ek wolris neamd de oergong nei taryf.
Dêrnei kin it effekt fan 'e stimulearring op' e útkomst definiearre wurde foar persoan \(i\) as:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Fierder kin dizze kwantiteit definieare wurde oer de hiele befolking as
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Uteinlik kinne wy skatte \(\text{ITT}_{Y}\) gebrûk fan gegevens:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
Wêr't \(\bar{Y}^{\text{obs}}_1\) is de beoardielde resultaat (bygelyks earnings) foar dyjingen dy't stimulearre binne (bygelyks tekene) en \(\bar{W}^{\text{obs}}_0\) is it beoardielde resultaat foar wa't net stimulearre is.
Uteinlik meitsje wy ús omtinken foar it effekt fan belang: it effekt fan 'e primêre behanneling (bygelyks militêre tsjinsten) oer de resultaten (bygelyks earnings). Spitigernôch stelt it út dat men net allinich dizze effekt op alle ienheden wurdearje kin. Lykwols, mei guon foarnammen, kinne ûndersikers de effekt fan 'e behanneling oer kompleeters skatte (dus minsken dy't tsjinst wurde as gearwurke en minsken dy't net tsjinje wolle as tabel 2.7). Ik sille dit skandaal neamt de komplete trochsnee koarsk effekt (CACE) (dy't ek wol it lokale gemiddelde behanneling effekt wurdt , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
dêr't \(G_i\) de groep fan persoanen \(i\) (sjoch tabel 2.7) \(G_i\) en \(G_i\) \(N_{\text{co}}\) is it tal kompleksers. Mei oare wurden, eq. 2.11 fergelike de fertsjinsten fan kompleksers dy't opnommen binne \(Y_i(1, W_i(1))\) en net opnommen \(Y_i(0, W_i(0))\) . De skandaal yn eq. 2.11 liket hurder om te beskôgjen fan observearre gegevens om't it net mooglik is om kompleenten mei identifisearre gegevens te identifisearjen (om te witten as immen komplekt is dat jo observearje moatte as hy opsteld hat as oanmeld en oft hy tsjinne as net opnommen is).
It bliuwt - wat oerweldigend - dat as der in oantal kompleksjes binne, dan foarsafier't men trije ekstra oanwizingen makket, is it mooglik om CACE te beskôgjen fan bewarre gegevens. Earst moat men ferwize dat de opdracht foar behanneling is willekeurich. Yn it gefal fan it ûntwerp fan lotterij is dit leefber te wêzen. Lykwols, yn guon ynstellings dêr't natuerlike eksperiminten net betinke op fysike randomisaasje, kin dizze hypoteek mear problematysk wêze. Twadder moat men ferwize dat harren gjin definysters binne (dizze oertsjûging wurdt soms ek wol de monotonisaasje-hypoteze neamd). Yn it ramt fan it ûntwerp liket it reden om te sizzen dat der in soad minsken binne dy't net tsjinje as tsjinst wurde en tsjinje as se net opnommen wurde. Tredde, en úteinlik, komt de wichtichste oerienkomst dy't de útsluting beheining neamd wurdt . Under de útsluting fan beheinings moat men der fan úttsjinje dat al it effekt fan 'e behanneling oanbelanget troch de behanneling sels trochjûn wurdt. Mei oare wurden: men moat der fan úttsjinje dat der gjin direkte ynfloed is fan stimulearring op resultaten. Yn it gefal fan 'e lokaasje fan lotterij moat men oannimme dat de ûntwerpstatus gjin effekt hat op oare earnings as fia militêre tsjinst (figuer 2.11). De útsluting beheining kin ferlingd wurde as bygelyks minsken dy't ûntwerpen mear tiid yn 'e skoalle opsteld hawwe om tsjinst te fertsjinjen of as wurkjouwers minder wiene om minsken te meitsjen dy't opsteld waarden.
As dizze trije betingsten (willekeurige oanbelangingen oan behanneling, gjin definysters, en de útsluting beheining) wurde binne, dan
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
sadat we kinne CACE ôfstelje:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Ien manier om te tinken oer CACE is dat it ferskil yn resultaten is tusken dejingen dy't stimulearre binne en dy net stimulearre, opblaasd troch de optochtnota.
Der binne twa wichtige opslach om te hâlden. Earst is de útslutingsbeskerming in sterke oanfetting, en it moat rjochtfeardich wêze op in saaklike basis, dy't faak needsaaklike subsydzje-ekspertise freget. De útsluting beheining kin net rjochtfeardich wêze mei randomisearring fan 'e stimulearring. Twadder is in mienskiplike praktyske útdaging mei ynstrumintale fariabele analyse komt as de stimulearre hat net folle effekt op de opset fan behanneling (as \(\text{ITT}_W\) is lyts). Dit wurdt in swak ynstrumint neamd , en it liedt ta ferskate problemen (Imbens and Rosenbaum 2005; Murray 2006) . Ien of wize om te tinken oer it probleem mei swakke ynstruminten is dat \(\widehat{\text{CACE}}\) kin gefoelich wêze foar lytse biases yn \(\widehat{\text{ITT}_Y}\) -puntlik fanwege ferwûningen fan 'e útsluting-beheining-om't dizze biases grut wurde troch in lyts \(\widehat{\text{ITT}_W}\) (sjoch ek 2.13). Rûch, as de behanneling dy't de natuer oanbelanget hat gjin grutte ynfloed op 'e behanneling dy't jo soargen hawwe, dan sille jo in hurde tiid learje oer de behanneling dy't jo soargje.
Sjoch haadstik 23 en 24 fan Imbens and Rubin (2015) foar in mear formele ferzje fan dizze diskusje. De tradisjonele ekologyske oanpak fan ynstrumintale fariabelen wurdt typysk útdrukt yn 'e betsjuttings fan it beskôgjen fan lykweardigens, net potensjele resultaten. Foar in ynlieding fan dit oare perspektyf sjogge Angrist and Pischke (2009) , en foar in fergeliking tusken de beide oanpak, sjoch it paragraaf 24.6 fan Imbens and Rubin (2015) . In alternatyf, wat minder formele presintaasje fan de ynstrumintale fariabele oanpak is yn haadstik 6 fan Gerber and Green (2012) . Foar mear op 'e útsluting foar beheining, sjoch D. Jones (2015) . Aronow and Carnegie (2013) beskriuwe in ekstra set fan hypotypes dy't brûkt wurde om ATE te skôgjen as CACE. Foar mear oer hoe't natuerlike eksperiminten tige Sekhon and Titiunik (2012) wêze kinne om te ynterpretearjen, sjoch Sekhon and Titiunik (2012) . Foar in mear algemiene ynlieding foar natuerlike eksperiminten - ien dy't net allinich de ynstrumintale fariabelen giet, sille ek ûntwerpen wurde lykas regression-disontinuiteit-sjoch Dunning (2012) .