Í þessu viðauka mun ég draga saman nokkrar hugmyndir um að orsaka orsakasamhengi frá gögnum sem ekki eru tilraunir í aðeins meira stærðfræðilegu formi. Það eru tvær helstu aðferðir: The causal graph ramma, sem mest tengist Judea Pearl og samstarfsfólki, og hugsanlega útkomu ramma, mest tengd við Donald Rubin og samstarfsmenn. Ég mun kynna hugsanlega útkomu ramma vegna þess að það er nánari tengsl við hugmyndirnar í stærðfræðilegum athugasemdum í lok 3. og 4. kafla. Fyrir frekari upplýsingar um ramma um orsakatengsl, mælum ég með Pearl, Glymour, and Jewell (2016) (inngangsorð ) og Pearl (2009) (háþróaður). Fyrir bók lengd meðferðar á orsakasamhengi sem sameinar hugsanlega útkomu ramma og grunnlínu ramma, mælum ég með Morgan and Winship (2014) .
Markmið þessa viðauka er að hjálpa þér að kynnast merkingu og stíl hugsanlegrar afleiðingarhefðar þannig að þú getir skipt yfir í eitthvað af þeim tæknilegu efni sem er skrifað um þetta efni. Í fyrsta lagi lýsi ég hugsanlegum árangursramma. Þá mun ég nota það til að ræða frekar náttúrulegar tilraunir eins og Angrist (1990) um áhrif hernaðarþjónustu á tekjur. Þetta viðhengi dregur mikið á Imbens and Rubin (2015) .
Möguleg útkoman ramma
Möguleiki á árangursramma hefur þrjá meginþætti: einingar , meðferðir og hugsanlegar niðurstöður . Til að lýsa þessum þáttum, skulum við íhuga stílhrein útgáfu af þeirri spurningu sem beint er til í Angrist (1990) : Hver er áhrif hernaðarþjónustu á tekjur? Í þessu tilviki getum við skilgreint einingarnar til að vera menn sem eiga rétt á 1970 drögum í Bandaríkjunum, og við getum vísað þetta fólk með \(i = 1, \ldots, N\) . Meðferðin í þessu tilfelli getur verið "að þjóna í hernum" eða "ekki þjóna í hernum." Ég kalla þetta að meðhöndla og stjórna aðstæðum, og ég ætla að skrifa \(W_i = 1\) ef maður \(i\) er í meðferð ástandi og \(W_i = 0\) ef manneskja \(i\) er í stjórn ástandi. Að lokum eru hugsanlegar afleiðingar svolítið huglægari erfitt vegna þess að þeir fela í sér "hugsanlegar" niðurstöður; hlutir sem gætu hafa gerst. Fyrir hvern einstakling sem er hæfur til drögin frá 1970 getum við ímyndað sér það magn sem þeir hefðu unnið á árinu 1978 ef þeir þjónuðu í herinn, sem ég mun kalla \(Y_i(1)\) og það magn sem þeir myndu hafa aflað í 1978 ef þeir þjónuðu ekki í herinn, sem ég mun kalla \(Y_i(0)\) . Í hugsanlegum árangursramma eru \(Y_i(1)\) og \(Y_i(0)\) talin fast magn, en \(W_i\) er slembibreyta.
Val á einingum, meðferðum og niðurstöðum er mikilvægt vegna þess að það skilgreinir hvað hægt er og getur ekki lært af rannsókninni. Val á einingum, fólki sem er gjaldgengt fyrir 1970 drögin - nær ekki til kvenna, og svo án frekari forsendna, mun þessi rannsókn ekki segja okkur neitt um áhrif herþjónustu á konur. Ákvarðanir um hvernig á að skilgreina meðferðir og niðurstöður eru einnig mikilvægar. Til dæmis, ætti áhugaleysi að einbeita sér að því að þjóna í herinn eða upplifa bardaga? Ætti vaxtamunur að vera tekjur eða starfsánægju? Að lokum ætti val á einingum, meðferðum og niðurstöðum að vera knúin áfram af vísindalegum og stefnumótandi markmiðum rannsóknarinnar.
Með hliðsjón af vali eininga, meðferða og hugsanlegra niðurstaðna er orsakatengsl meðferðarinnar á manneskju \(i\) , \(\tau_i\) ,
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Með öðrum orðum, bera við saman hversu mikið manneskja \(i\) hefði unnið eftir að hafa þjónað því hversu mikið manneskja \(i\) hefði unnið án þess að þjóna. Fyrir mig, eq. 2.1 er skýrasta leiðin til að skilgreina orsakasamhengi og þótt mjög einfalt sé þessi rammi algengari á mörgum mikilvægum og áhugaverðum leiðum (Imbens and Rubin 2015) .
Þegar við notum hugsanlegan árangur ramma finnst mér oft það gagnlegt að skrifa út töflu sem sýnir hugsanlega niðurstöðu og meðferðaráhrif fyrir alla einingarnar (tafla 2.5). Ef þú ert ekki fær um að ímynda þér borð eins og þetta fyrir námið, þá gætir þú þurft að vera nákvæmari í skilgreiningum þínum á einingum þínum, meðferðum og hugsanlegum árangri.
Manneskja | Hagnaður í meðferðarástandi | Hagnaður í stjórn ástandi | Meðferð áhrif |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Vondur | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Þegar við skilgreinum orsakasamhengið með þessum hætti, lendum við hins vegar í vandamál. Í nánast öllum tilvikum, við fáum ekki að fylgjast með báðum hugsanlegum niðurstöðum. Það er, tiltekinn maður þjónaði annaðhvort eða þjónaði ekki. Þess vegna virðum við eitt af hugsanlegum niðurstöðum - \(Y_i(1)\) eða \(Y_i(0)\) en ekki bæði. Vanhæfni til að fylgjast með báðum hugsanlegum niðurstöðum er svo stórt vandamál að Holland (1986) kallaði það grundvallarvandamálið af orsakasamhengi .
Sem betur fer, þegar við erum að gera rannsóknir, höfum við ekki bara einn mann; heldur höfum við mörg fólk, og þetta býður upp á leið um grundvallarvandamálið af orsakasamhengi. Í stað þess að reyna að meta einstaklingsbundin meðferðaráhrif getum við metið meðaltal meðferðaráhrif fyrir alla einingar:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Þessi jöfnu er enn tjáð hvað varðar \(\tau_i\) , sem er ekki áberandi, en með sumum algebru (eq 2.8 af Gerber and Green (2012) ) fáum við
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Þetta sýnir að ef við getum því reiknað með landsmönnum meðaltali útkomu sem er til meðferðar ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) og íbúum meðaltal útkoman í skefjum ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), þá getum við metið meðaltal meðferðaráhrif, jafnvel án þess að meta meðferðaráhrif fyrir tiltekna einstakling.
Nú þegar ég hef skilgreint áætlun okkar - það sem við erum að reyna að meta-ég mun snúa við hvernig við getum í raun metið það með gögnum. Og hér hlaupum við beint inn í vandamálið sem við fylgjumst aðeins við eitt af hugsanlegum árangri fyrir hvern einstakling; sjáum við annaðhvort \(Y_i(0)\) eða \(Y_i(1)\) (tafla 2.6). Við gætum metið meðaltal meðferðaráhrif með því að bera saman tekjur fólks sem þjónaði tekjum fólks sem ekki þjónaði:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
þar sem \(N_t\) og \(N_c\) eru fjöldi fólks í meðferð og eftirlitsskilyrðum. Þessi aðferð mun virka vel ef meðferðarverkefnið er óháð hugsanlegum niðurstöðum, ástand sem er stundum kallað ókunnleiki . Því miður, ef engin tilraun er fyrir hendi, er ónýtanlegt ekki oft ánægð, sem þýðir að áætlunin í eq. 2.4 er ekki líklegt að framleiða góða mat. Ein leið til að hugsa um það er að í fjarveru handahófi verkefnisins, eq. 2.4 er ekki að bera saman eins og með eins; það er að bera saman tekjur af mismunandi tegundum fólks. Eða lýst svolítið öðruvísi, án handahófskenntrar meðferðar, er úthlutun meðferðar líklega tengd hugsanlegum niðurstöðum.
Í kafla 4 lýsi ég hvernig slembiröðuðum samanburðarrannsóknum geti hjálpað vísindamönnum að gera orsakatölur og hér lýsi ég hvernig vísindamenn geta nýtt sér náttúrulegar tilraunir, svo sem drög að happdrætti.
Manneskja | Hagnaður í meðferðarástandi | Hagnaður í stjórn ástandi | Meðferð áhrif |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Vondur | ? | ? | ? |
Náttúrulegar tilraunir
Ein aðferð til að gera orsakasamlegar ástæður án þess að keyra tilraun er að leita að því sem er að gerast í heiminum sem hefur handahófi úthlutað meðferð fyrir þig. Þessi nálgun er kölluð náttúruleg tilraunir . Í mörgum tilfellum, því miður, eykur eðli ekki af handahófi meðferð sem þú vilt að fólkið sem hefur áhuga á. En stundum skilar náttúrunni af handahófi tengdum meðferð. Einkum mun ég íhuga málið þar sem einhver annarri meðferð er til staðar sem hvetur fólk til að fá aðalmeðferðina . Til dæmis gæti drögin talist handahófskennd framhaldsmeðferð sem hvatti fólk til að taka aðalmeðferðina, sem var að þjóna í hernum. Þessi hönnun er stundum kallaður hvatningarhönnun . Og greiningaraðferðin sem ég lýsi til að takast á við þetta ástand er stundum kallað hljóðfæri . Í þessari stillingu, með einhverjum forsendum, geta vísindamenn notað hvatningu til að læra um áhrif aðalmeðferðar fyrir tiltekna undirhóp eininga.
Til þess að takast á við tvö mismunandi meðferðir - hvatningu og aðalmeðferð - þurfum við nýjan merkingu. Segjum að sumt fólk sé handahófi ritað ( \(Z_i = 1\) ) eða ekki ritað ( \(Z_i = 0\) ); Í þessu ástandi er \(Z_i\) stundum kallað tæki .
Meðal þeirra sem voru skrifuð, þjónuðu sumir ( \(Z_i = 1, W_i = 1\) ) og sumir gerðu ekki ( \(Z_i = 1, W_i = 0\) ). Sömuleiðis, meðal þeirra sem ekki voru skrifaðar, þjónuðu sumir ( \(Z_i = 0, W_i = 1\) ) og sumir gerðu ekki ( \(Z_i = 0, W_i = 0\) ). Hugsanlegar niðurstöður fyrir hvern einstakling geta nú verið stækkaðir til að sýna stöðu þeirra fyrir bæði hvatningu og meðferð. Til dæmis, láta \(Y(1, W_i(1))\) vera tekjur einstaklings \(i\) ef hann var skrifaður, þar sem \(W_i(1)\) er þjónustustaða hans ef hann er skrifaður. Ennfremur getum við skipt íbúum í fjóra hópa: samanburðarfólk, aldrei-takers, defiers og alltaf-takers (tafla 2.7).
Gerð | Þjónusta ef skrifuð | Þjónusta ef ekki ritað |
---|---|---|
Compliers | Já, \(W_i(Z_i=1) = 1\) | Nei, \(W_i(Z_i=0) = 0\) |
Aldrei-takers | Nei, \(W_i(Z_i=1) = 0\) | Nei, \(W_i(Z_i=0) = 0\) |
Defiers | Nei, \(W_i(Z_i=1) = 0\) | Já, \(W_i(Z_i=0) = 1\) |
Alltaf-takers | Já, \(W_i(Z_i=1) = 1\) | Já, \(W_i(Z_i=0) = 1\) |
Áður en við ræðum að meta áhrif meðferðarinnar (þ.e. herþjónustu), getum við fyrst skilgreint tvö áhrif hvatningarinnar (þ.e. eru teknar). Í fyrsta lagi getum við skilgreint áhrif hvatningarinnar á aðalmeðferð. Í öðru lagi getum við skilgreint áhrif hvatningarinnar á niðurstöðuna. Það kemur í ljós að hægt er að sameina þessi tvö áhrif til að meta áhrif meðferðarinnar á tiltekna hóp fólks.
Í fyrsta lagi er hægt að skilgreina áhrif hvatningarinnar á meðferð fyrir einstaklinga \(i\) sem
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Ennfremur er hægt að skilgreina þetta magn yfir alla íbúa sem
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Að lokum getum við metið \(\text{ITT} _{W}\) með því að nota gögn:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
þar sem \(\bar{W}^{\text{obs}}_1\) er meðhöndlað hlutfall meðferðar fyrir þá sem voru hvattir og \(\bar{W}^{\text{obs}}_0\) er sá meðferðartíðni hjá þeim sem ekki voru hvattir til. \(\text{ITT}_W\) er einnig stundum kallað upptökuhlutfallið .
Næst er hægt að skilgreina áhrif hvatningarinnar á niðurstöðu fyrir manneskja \(i\) sem:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Ennfremur er hægt að skilgreina þetta magn yfir alla íbúa sem
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Að lokum getum við metið \(\text{ITT}_{Y}\) með því að nota gögn:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
þar sem \(\bar{Y}^{\text{obs}}_1\) er frammistaða niðurstaðan (td tekjur) fyrir þá sem voru hvattir (td skrifaðir) og \(\bar{W}^{\text{obs}}_0\) er frammistaða niðurstaða fyrir þá sem ekki voru hvattir til.
Að lokum vekjum við athygli okkar á áhugaleysi: áhrif aðalmeðferðarinnar (td herþjónustu) á niðurstöðuna (td tekjur). Því miður kemur í ljós að ekki er hægt að meta þessa áhrif á alla einingarnar almennt. Hins vegar, með nokkrum forsendum, geta vísindamenn metið áhrif meðferðarinnar á samanburðarmenn (þ.e. fólk sem mun þjóna ef unnið er og fólk sem mun ekki þjóna ef ekki er unnið, tafla 2.7). Ég mun kalla þetta mat á meðalgildi orsakatengslanna (CACE) (sem einnig er stundum kallað staðbundin meðaltal meðferðaráhrif , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
þar sem \(G_i\) gefur hópnum manneskju \(i\) (sjá töflu 2.7) og \(N_{\text{co}}\) er fjöldi samanburða. Með öðrum orðum, eq. 2.11 samanstendur af tekjum samanburða sem eru teknar \(Y_i(1, W_i(1))\) og ekki dregin \(Y_i(0, W_i(0))\) . Matið í eq. 2.11 virðist erfitt að meta gögn sem komu fram vegna þess að ekki er hægt að bera kennsl á þýðendur með því að nota aðeins framlengdar upplýsingar (til að vita hvort einhver sé complier þú þyrfti að fylgjast með hvort hann starfaði þegar hann var skrifaður og hvort hann starfaði þegar hann var ekki skrifaður).
Það kemur í ljós - nokkuð á óvart - að ef einhverjir eru samanburðaraðilar, þá er gert ráð fyrir að einn gerir þrjá viðbótar forsendur, er hægt að meta CACE frá gögnum sem komu fram. Í fyrsta lagi þarf að gera ráð fyrir að verkefni til meðferðar sé handahófi. Að því er varðar drög að happdrætti er þetta sanngjarnt. Í sumum stillingum þar sem náttúrulegar tilraunir treysta ekki á líkamlegri slembival, getur þetta forsenda verið erfiðara. Í öðru lagi þarf að gera ráð fyrir að þær séu ekki defiers (þetta forsendan er einnig stundum kallað einmana forsendan). Í samhengi við drögin virðist vera sanngjarnt að gera ráð fyrir að það séu mjög fáir sem vilja ekki þjóna ef þau eru skrifuð og munu þjóna ef þær eru ekki skrifaðar. Í þriðja lagi, og að lokum, kemur mikilvægasta forsendan sem kallast útilokunarhindrunin . Undir útilokunar takmörkununni verður að gera ráð fyrir að öll áhrif meðferðarverkefnisins fara fram í gegnum sjálfsmeðferðina. Með öðrum orðum verður maður að gera ráð fyrir að ekki sé bein áhrif á hvatningu á niðurstöðum. Þegar um er að ræða happdrætti, þarf maður að gera ráð fyrir að drög að stöðu hafi engin áhrif á aðra tekjur en með herþjónustu (mynd 2.11). Útilokunarhindrunin gæti verið brotin ef til dæmis fólk sem var ritað eyddi meiri tíma í skólanum til að koma í veg fyrir þjónustu eða ef vinnuveitendur voru líklegri til að ráða fólk sem var ritað.
Ef þessi þrjú skilyrði (slembiraðað til meðferðar, engin defiers og útilokunarhindrunin) eru uppfyllt þá
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
þannig að við getum metið CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Ein leið til að hugsa um CACE er að það er munurinn á niðurstöðum þeirra sem voru hvattir og þeir sem ekki voru hvattir til að uppblásna af upptökuhraða.
Það eru tveir mikilvægar forsendur að hafa í huga. Í fyrsta lagi er útilokunarhindrunin sterk forsenda og þarf að rökstyðja það í hverju tilviki, sem oft krefst fagþekkingar á sviði sérsviðs. Ekki er hægt að réttlæta útilokunarhindrunina með slembivali hvatningarinnar. Í öðru lagi kemur sameiginlegur hagnýtur áskorun með greiningartækni til greina þegar \(\text{ITT}_W\) hefur lítil áhrif á upptöku meðferðar (þegar \(\text{ITT}_W\) er lítill). Þetta er kallað veikburða tæki og það leiðir til margvíslegra vandamála (Imbens and Rosenbaum 2005; Murray 2006) . Ein leið til að hugsa um vandamálið með veikburða hljóðfæri er að \(\widehat{\text{CACE}}\) getur verið viðkvæm fyrir litlum hlutdrægni í \(\widehat{\text{ITT}_Y}\) brot á útilokunar takmörkuninni - vegna þess að þessi hlutdrægni stækkar með lítilli \(\widehat{\text{ITT}_W}\) (sjá \(\widehat{\text{ITT}_W}\) 2.13). Gróft, ef meðferðin sem eðli tengir hefur ekki mikil áhrif á meðferðina sem þú hefur áhyggjur af, þá muntu eiga erfitt með að læra um meðferðina sem þú hefur áhyggjur af.
Sjá kafla 23 og 24 í Imbens and Rubin (2015) fyrir formlegri útgáfu þessa umræðu. Hin hefðbundna hagfræðilega nálgun á hljóðfæraleikjum er yfirleitt tjáð með því að meta jöfnur, ekki hugsanlegar niðurstöður. Fyrir kynningu frá þessu sjónarhorni, sjáðu Angrist and Pischke (2009) og til samanburðar á tveimur aðferðum, sjá kafla 24.6 Imbens and Rubin (2015) . Óákveðinn greinir í ensku val, örlítið minna formleg kynning á instrumental breytum nálgun er að finna í kafla 6 af Gerber and Green (2012) . Fyrir frekari upplýsingar um útilokunarhindrunina, sjá D. Jones (2015) . Aronow and Carnegie (2013) lýsa viðbótarmörkum forsendum sem hægt er að nota til að meta ATE frekar en CACE. Fyrir frekari upplýsingar um hvernig náttúrulegar tilraunir geta verið mjög erfiður að túlka, sjá Sekhon and Titiunik (2012) . Fyrir almennari kynningu á náttúrulegum tilraunum-einn sem fer út fyrir aðeins leiðsagnarbreytur nálgun að einnig fela í sér hönnun eins og afturköllun hætta-sjá Dunning (2012) .