Në këtë shtojcë, unë do të përmbledh disa ide rreth nxjerrjes shkakësore nga të dhënat jo-eksperimentale në një formë pak më matematikore. Ka dy qasje kryesore: korniza shkakësore grafike, më e lidhur me Judea Pearl dhe kolegët, dhe kuadri i mundshëm i rezultateve, më së shumti i lidhur me Donald Rubinin dhe kolegët. Unë do të prezantoj kornizën e rezultateve potenciale sepse është më e lidhur me idetë në shënimet matematikore në fund të kapitullit 3 dhe 4. Për më shumë mbi kornizën grafike të shkaktuar, unë rekomandoj Pearl, Glymour, and Jewell (2016) (hyrëse ) dhe Pearl (2009) (të avancuar). Për një trajtim të gjatësisë së librit të përfundimit shkakor që kombinon kornizën e rezultateve potenciale dhe kornizën shkakësore të grafikut, unë rekomandoj Morgan and Winship (2014) .
Qëllimi i kësaj shtojce është t'ju ndihmojë të merrni rehat me notimin dhe stilin e traditës së rezultateve të mundshme, në mënyrë që të kaloni në disa nga materialet më teknike të shkruara në këtë temë. Së pari, unë do të përshkruaj kuadrin e mundshëm të rezultateve. Pastaj, do ta përdor për të diskutuar më tej eksperimentet natyrore si ajo e Angrist (1990) mbi efektin e shërbimit ushtarak mbi të ardhurat. Kjo shtojcë tërheq shumë në Imbens and Rubin (2015) .
Kuadri i rezultateve potenciale
Kuadri i rezultateve potenciale ka tre elemente kryesore: njësitë , trajtimet dhe rezultatet e mundshme . Për të ilustruar këto elemente, le të shqyrtojmë një version të stilizuar të pyetjes së adresuar në Angrist (1990) : Cila është efekti i shërbimit ushtarak mbi të ardhurat? Në këtë rast, ne mund të përcaktojmë njësitë që të jenë njerëzit që kanë të drejtë për projektin e vitit 1970 në Shtetet e Bashkuara, dhe ne mund të indeksojmë këta njerëz me \(i = 1, \ldots, N\) . Trajtimet në këtë rast mund të jenë "duke shërbyer në ushtri" ose "duke mos shërbyer në ushtri." Unë do t'i quaj këto kushte të trajtimit dhe kontrollit, dhe do të shkruaj \(W_i = 1\) nëse personi \(i\) është në gjendje të trajtimit dhe \(W_i = 0\) nëse personi \(i\) është në gjendje kontrolli. Së fundi, rezultatet e mundshme janë pak më konceptuale të vështira, sepse ato përfshijnë rezultate "potenciale"; gjëra që mund të kishin ndodhur. Për secilin person që kualifikohet për projektin e vitit 1970, mund të imagjinojmë shumën që do të kishin fituar në vitin 1978 nëse ata shërbenin në ushtri, të cilën do ta quaja \(Y_i(1)\) dhe shumën që do të kishin fituar në 1978 nëse ata nuk shërbejnë në ushtri, të cilën unë do ta quaj \(Y_i(0)\) . Në kuadrin e rezultateve potenciale, \(Y_i(1)\) dhe \(Y_i(0)\) konsiderohen sasi fikse, ndërsa \(W_i\) është një ndryshore e rastit.
Zgjedhja e njësive, trajtimeve dhe rezultateve është kritike sepse përcakton se çfarë mund dhe nuk mund të mësohet nga studimi. Zgjedhja e njësive - njerëzit që kanë të drejtë për projektin e vitit 1970 - nuk përfshin gratë, dhe kështu pa supozime shtesë, ky studim nuk do të na tregojë asgjë për efektin e shërbimit ushtarak ndaj grave. Vendimet për mënyrën e definimit të trajtimeve dhe rezultateve janë gjithashtu të rëndësishme. Për shembull, a duhet trajtimi i interesit të përqendrohet në shërbimin në ushtri apo në luftën me përjetime? A duhet rezultati i interesit të jetë fitim ose kënaqësi pune? Në fund të fundit, zgjedhja e njësive, trajtimeve dhe rezultateve duhet të nxitet nga qëllimet shkencore dhe politike të studimit.
Duke pasur parasysh zgjedhjen e njësive, trajtimeve dhe rezultateve të mundshme, efekti shkakësor i trajtimit ndaj personit \(i\) , \(\tau_i\) , është
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Me fjalë të tjera, ne e krahasojmë sa personi \(i\) do të kishte fituar pasi ka shërbyer për të si njeri shumë \(i\) do të kishte fituar pa shërbejnë. Për mua, eq. 2.1 është mënyra më e qartë për të përcaktuar një efekt shkaktar, dhe megjithëse jashtëzakonisht i thjeshtë, ky kuadër rezulton i përgjithësueshëm në shumë mënyra të rëndësishme dhe interesante (Imbens and Rubin 2015) .
Kur përdorim kornizën e rezultateve potenciale, shpesh e gjej të dobishëm të shkruaj një tabelë që tregon rezultatet e mundshme dhe efektet e trajtimit për të gjitha njësitë (tabela 2.5). Nëse nuk jeni në gjendje të imagjinoni një tabelë si kjo për studimin tuaj, atëherë mund t'ju duhet të jeni më të saktë në përkufizimet tuaja për njësitë tuaja, trajtimet dhe rezultatet e mundshme.
person | Fitimet në gjendje të trajtimit | Fitimet në gjendje kontrolli | Efekti i trajtimit |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
do të thotë | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Kur përcaktohet efekti shkakësor në këtë mënyrë, megjithatë, ne ballafaqohemi me një problem. Në pothuajse të gjitha rastet, nuk arrijmë t'i vëmë veshin të dyja rezultateve të mundshme. Kjo është, një person i caktuar ose ka shërbyer ose nuk ka shërbyer. Prandaj, vërejmë një prej rezultateve të mundshme - \(Y_i(1)\) ose \(Y_i(0)\) - por jo të dyja. Paaftësia për të vëzhguar të dy rezultatet e mundshme është një problem i tillë i madh që Holland (1986) quajti atë Problemi Themelor i Inferencës Kauzale .
Për fat të mirë, kur bëjmë kërkime, nuk kemi vetëm një person; përkundrazi, kemi shumë njerëz, dhe kjo ofron një mënyrë përreth Problemit Fundamental të Përfundimit Kauzal. Në vend që të përpiqemi të vlerësojmë efektin e trajtimit në nivel individual, ne mund të vlerësojmë efektin mesatar të trajtimit për të gjitha njësitë:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Ky ekuacion ende shprehet në terma të \(\tau_i\) , të cilat nuk janë të vëzhgueshme, por me disa algjebër (eq 2.8 e Gerber and Green (2012) ),
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Kjo tregon se nëse ne mund të vlerësojmë rezultatin mesatar të popullsisë në trajtim ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) dhe rezultati mesatar i popullsisë nën kontroll ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), atëherë mund të vlerësojmë efektin mesatar të trajtimit, madje pa e vlerësuar efektin e trajtimit për ndonjë person të caktuar.
Tani që e kam përcaktuar vlerësimin tonë dhe gjëja që po përpiqemi të vlerësojmë, do të kthehem në atë se si mund ta vlerësojmë me të dhëna. Dhe këtu ne drejtojmë drejtpërdrejt në problemin që ne vetëm vëzhgojmë një nga rezultatet e mundshme për secilin person; ne shohim ose \(Y_i(0)\) ose \(Y_i(1)\) (tabela 2.6). Mund të vlerësonim efektin mesatar të trajtimit duke krahasuar të ardhurat e njerëzve që shërbenin me të ardhurat e njerëzve që nuk shërbenin:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
ku \(N_t\) dhe \(N_c\) janë numri i njerëzve në kushtet e trajtimit dhe kontrollit. Kjo qasje do të funksionojë mirë nëse caktimi i trajtimit është i pavarur nga rezultatet e mundshme, një kusht i quajtur nganjëherë i paditur . Për fat të keq, në mungesë të një eksperimenti, injorueshmëria shpesh nuk është e kënaqur, që do të thotë se vlerësuesi në eq. 2.4 nuk ka të ngjarë të prodhojë një vlerësim të mirë. Një mënyrë për të menduar për këtë është se në mungesë të caktimit të rastit të trajtimit, eq. 2.4 nuk është duke krahasuar me si; është duke krahasuar të ardhurat e llojeve të ndryshme të njerëzve. Ose shprehet pak më ndryshe, pa caktimin e rastësishëm të trajtimit, shpërndarja e trajtimit ka të ngjarë të lidhet me rezultatet e mundshme.
Në kapitullin 4, unë do të përshkruaj se si eksperimentet e kontrolluara me randomizim mund të ndihmojnë kërkuesit që të bëjnë vlerësime shkakësore dhe këtu do të përshkruaj se si hulumtuesit mund të përfitojnë nga eksperimentet natyrore, siç është drafti i projekteve.
person | Fitimet në gjendje të trajtimit | Fitimet në gjendje kontrolli | Efekti i trajtimit |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
do të thotë | ? | ? | ? |
Eksperimentet natyrore
Një qasje për të bërë vlerësime shkakësore pa kryer një eksperiment është të shikoni për diçka që po ndodh në botë që ka caktuar rastësisht një trajtim për ju. Kjo qasje quhet eksperimente natyrore . Në shumë situata, për fat të keq, natyra nuk jep rastësisht trajtimin që dëshiron për popullatën me interes. Por ndonjëherë, natyra jep rastësisht një trajtim të lidhur. Në veçanti, unë do të shqyrtoj rastin kur ekziston një trajtim dytësor që inkurajon njerëzit që të marrin trajtimin primar . Për shembull, drafti mund të konsiderohet një trajtim dytësor i caktuar rastësisht që inkurajoi disa njerëz që të merrnin trajtimin parësor, i cili shërbehej në ushtri. Ky dizajn nganjëherë quhet një dizajn inkurajimi . Dhe metoda e analizës që unë do të përshkruaj për të trajtuar këtë situatë nganjëherë quhet variabla instrumentale . Në këtë mjedis, me disa supozime, hulumtuesit mund të përdorin inkurajimin për të mësuar rreth efektit të trajtimit primar për një nëngrup të veçantë të njësive.
Për të trajtuar dy trajtimet e ndryshme - inkurajimin dhe trajtimin parësor - kemi nevojë për një notim të ri. Supozoni se disa njerëz janë hartuar rastësisht ( \(Z_i = 1\) ) ose nuk janë hartuar ( \(Z_i = 0\) ); në këtë situatë, \(Z_i\) nganjëherë quhet një instrument .
Ndërmjet atyre që u hartuan, disa shërbyen ( \(Z_i = 1, W_i = 1\) ) dhe disa nuk ( \(Z_i = 1, W_i = 0\) ). Po ashtu, në mesin e atyre që nuk ishin hartuar, disa shërbyen ( \(Z_i = 0, W_i = 1\) ) dhe disa nuk ( \(Z_i = 0, W_i = 0\) ). Rezultatet e mundshme për secilin person tani mund të zgjerohen për të treguar statusin e tyre si për inkurajimin ashtu edhe për trajtimin. Për shembull, \(Y(1, W_i(1))\) do të jetë fitimi i personit \(i\) nëse ai është hartuar, ku \(W_i(1)\) është statusi i shërbimit të tij nëse është hartuar. Për më tepër, ne mund ta ndajmë popullsinë në katër grupe: bërës, mosmarrës, defilues dhe gjithmonë-marrës (tabela 2.7).
lloj | Shërbimi nëse është hartuar | Shërbimi nëse nuk është hartuar |
---|---|---|
hartuesit | Po, \(W_i(Z_i=1) = 1\) | Jo, \(W_i(Z_i=0) = 0\) |
Nuk-mbajtësve | Jo, \(W_i(Z_i=1) = 0\) | Jo, \(W_i(Z_i=0) = 0\) |
Defiers | Jo, \(W_i(Z_i=1) = 0\) | Po, \(W_i(Z_i=0) = 1\) |
Gjithmonë-mbajtësve | Po, \(W_i(Z_i=1) = 1\) | Po, \(W_i(Z_i=0) = 1\) |
Para se të diskutojmë për vlerësimin e efektit të trajtimit (dmth. Shërbimit ushtarak), së pari mund të përcaktojmë dy efektet e inkurajimit (dmth., Duke u hartuar). Së pari, ne mund të përcaktojmë efektin e inkurajimit në trajtimin parësor. Së dyti, ne mund të përcaktojmë efektin e inkurajimit mbi rezultatin. Do të tregojë se këto dy efekte mund të kombinohen për të dhënë një vlerësim të efektit të trajtimit në një grup të caktuar njerëzish.
Së pari, efekti i inkurajimit në trajtim mund të përcaktohet për personin \(i\) as
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Më tej, kjo sasi mund të përcaktohet mbi të gjithë popullsinë si
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Së fundi, ne mund të vlerësojmë \(\text{ITT} _{W}\) duke përdorur të dhënat:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
ku \(\bar{W}^{\text{obs}}_1\) është norma e vëzhguar e trajtimit për ata që janë inkurajuar dhe \(\bar{W}^{\text{obs}}_0\) shkalla e vëzhguar e trajtimit për ata që nuk ishin të inkurajuar. \(\text{ITT}_W\) gjithashtu nganjëherë quhet shkalla e pranimit .
Tjetra, efekti i nxitjes për rezultatin mund të përcaktohet për personin \(i\) si:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Më tej, kjo sasi mund të përcaktohet mbi të gjithë popullsinë si
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Së fundi, ne mund të vlerësojmë \(\text{ITT}_{Y}\) duke përdorur të dhënat:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
(p.sh., të ardhurat) për ata që ishin të inkurajuar (p.sh., hartuar) dhe \(\bar{W}^{\text{obs}}_0\) ) \(\bar{Y}^{\text{obs}}_1\) \(\bar{W}^{\text{obs}}_0\) është rezultati i vëzhguar për ata që nuk janë inkurajuar.
Së fundi, ne e kthejmë vëmendjen tonë në efektin e interesit: efektin e trajtimit primar (p.sh., shërbimi ushtarak) mbi rezultatin (p.sh. të ardhurat). Për fat të keq, del se në përgjithësi nuk mund të vlerësohet ky efekt në të gjitha njësitë. Sidoqoftë, me disa supozime, hulumtuesit mund të vlerësojnë efektin e trajtimit të personave që përmbushin detyrimet (dmth., Njerëzit që do të shërbejnë nëse janë të hartuar dhe njerëzit që nuk do të shërbejnë nëse nuk janë hartuar, tabela 2.7). Unë do ta quaj këtë vlerësim dhe efektin mesatar të shkaktuar pasues (CACE) (i cili nganjëherë nganjëherë quhet edhe efekt lokal i trajtimit lokal , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
ku \(G_i\) dhuron grupin e personit \(i\) (shih tabelën 2.7) dhe \(N_{\text{co}}\) është numri i compliers. Me fjalë të tjera, eq. 2.11 krahason të ardhurat e compliers që janë hartuar \(Y_i(1, W_i(1))\) dhe nuk janë hartuar \(Y_i(0, W_i(0))\) . Vlerësimi në eq. 2.11 duket e vështirë të vlerësohet nga të dhënat e vëzhguara, sepse nuk është e mundur të identifikohen compliers duke përdorur vetëm të dhënat e vëzhguara (për të ditur nëse dikush është përpilues ju do të duhet të vëzhgoni nëse ai ka shërbyer kur është hartuar dhe nëse ai ka shërbyer kur nuk është hartuar).
Rezulton - disi çuditërisht - se nëse ka ndonjë complier, atëherë kur dikush bën tre supozime shtesë, është e mundur të vlerësohet CACE nga të dhënat e vëzhguara. Së pari, duhet të supozohet se detyra për trajtim është e rastësishme. Në rastin e lotarisë së projekteve kjo është e arsyeshme. Megjithatë, në disa mjedise ku eksperimentet natyrore nuk mbështeten në randomizim fizik, ky supozim mund të jetë më problematik. Së dyti, duhet të supozojmë se nuk janë të pranishëm (ky supozim nganjëherë quhet edhe supozimi i monotonicitetit). Në kontekstin e draftit duket e arsyeshme të supozohet se ka shumë pak njerëz që nuk do të shërbejnë nëse janë hartuar dhe do të shërbejnë nëse nuk hartohen. E treta, dhe së fundi, vjen supozimi më i rëndësishëm që quhet kufizim i përjashtimit . Nën kufizimin e përjashtimit, duhet të supozojmë se të gjitha efektet e caktimit të trajtimit kalojnë përmes vetë trajtimit. Me fjalë të tjera, duhet të supozojmë se nuk ka efekt të drejtpërdrejtë të inkurajimit mbi rezultatet. Në rastin e lotarisë së projekteve, për shembull, duhet të supozohet se statusi i draftit nuk ka efekt mbi të ardhurat përveç shërbimit ushtarak (figura 2.11). Kufizimi i përjashtimit mund të shkelet nëse, për shembull, njerëzit që u hartuan shpenzuan më shumë kohë në shkollë për të shmangur shërbimin ose nëse punëdhënësit kishin më pak gjasa të punësonin njerëz të hartuar.
Nëse këto tre kushte (caktimi i rastësishëm në trajtim, pa defier, dhe kufizimi i përjashtimit) janë plotësuar, atëherë
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
kështu që ne mund të vlerësojmë CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Një mënyrë për të menduar për CACE është se është ndryshimi në rezultatet mes atyre që janë të inkurajuar dhe atyre që nuk inkurajohen, të fryra nga shkalla e pranimit.
Ka dy paralajmërime të rëndësishme për tu mbajtur në mend. Së pari, kufizimi i përjashtimit është një supozim i fortë dhe duhet të justifikohet rast pas rasti, i cili shpesh kërkon ekspertizë në fushën e lëndëve. Kufizimi i përjashtimit nuk mund të justifikohet me randomizimin e inkurajimit. Së dyti, një sfidë e zakonshme praktike me analizën instrumentale të ndryshueshme vjen kur inkurajimi ka pak efekt në marrjen e trajtimit (kur \(\text{ITT}_W\) është i vogël). Kjo quhet një instrument i dobët dhe çon në një sërë problemesh (Imbens and Rosenbaum 2005; Murray 2006) . Një mënyrë për të menduar për problemin me instrumente të dobëta është se \(\widehat{\text{CACE}}\) mund të jetë i ndjeshëm ndaj anshmërive të vogla në \(\widehat{\text{ITT}_Y}\) shkeljet e kufizimit të përjashtimit-sepse këto paragjykime janë zmadhuar nga një \(\widehat{\text{ITT}_W}\) (shih 2.13). Përafërsisht, nëse trajtimi që e cakton natyra nuk ka një ndikim të madh në trajtimin që ju intereson, atëherë do të keni një kohë të vështirë të mësoni rreth trajtimit që ju intereson.
Shikoni kapitullin 23 dhe 24 të Imbens and Rubin (2015) për një version më formal të këtij diskutimi. Qasja tradicionale ekonometrike ndaj variablave instrumental shprehet zakonisht në terma të vlerësimit të ekuacioneve, jo rezultateve të mundshme. Për një hyrje nga kjo perspektivë tjetër, shih Angrist and Pischke (2009) , dhe për një krahasim midis dy qasjeve, shih seksionin 24.6 të Imbens and Rubin (2015) . Një prezantim alternativ, pak më pak formal i qasjes së variablave instrumental është dhënë në kapitullin 6 të Gerber and Green (2012) . Për më shumë rreth kufizimit të përjashtimit, shih D. Jones (2015) . Aronow and Carnegie (2013) përshkruajnë një grup shtesë të supozimeve që mund të përdoren për të vlerësuar ATE dhe jo CACE. Për më shumë se si eksperimentet natyrore mund të jenë shumë të vështira për t'u interpretuar, shih Sekhon and Titiunik (2012) . Për një hyrje më të përgjithshme për eksperimentet natyrore - një që shkon përtej vetëm qasjes së variablave instrumentalë për të përfshirë edhe dizajne të tilla si mosfunksionimi i regresionit - shih Dunning (2012) .