V tem dodatku bom povzel nekatere ideje o vzročni izločitvi iz neeksperimentalnih podatkov v nekoliko bolj matematični obliki. Obstajata dva glavna pristopa: vzročni okvir, najbolj povezan z Judeo Pearl in sodelavci, in okvir potencialnih izidov, najbolj povezan z Donaldom Rubinom in sodelavci. Predstavil bom okvir potencialnih izidov, ker je tesneje povezan z idejami v matematičnih notah na koncu poglavij 3 in 4. Za več o okvirju vzročnih grafik priporočam Pearl, Glymour, and Jewell (2016) (uvodni ) in Pearl (2009) (napredna). Pri knjigovodski obdelavi vzročne zveze, ki združuje okvir potencialnih izidov in vzročni okvir, priporočam Morgan and Winship (2014) .
Cilj tega dodatka je, da vam pomaga pri razumevanju in slogu potencialnih izidov, da boste lahko prešli na nekaj bolj tehničnih gradiv, napisanih na tej temi. Najprej bom opisal okvir potencialnih izidov. Potem jo bom uporabil za nadaljnjo obravnavo naravnih eksperimentov, kot je tista, ki jo je Angrist (1990) o vplivu vojaške službe na zaslužek. Ta dodatek v veliki meri temelji na Imbens and Rubin (2015) .
Okvir potencialnih rezultatov
Okvir možnih izidov ima tri glavne elemente: enote , zdravljenje in morebitne rezultate . Za ponazoritev teh elementov si oglejmo stilizirano različico vprašanja, naslovljenega na Angrist (1990) : Kakšen je učinek vojaške službe na zaslužek? V tem primeru lahko enote opredelimo kot osebe, ki so upravičene do osnutka leta 1970 v Združenih državah, in jih lahko indeksiramo z \(i = 1, \ldots, N\) . Zdravljenje v tem primeru je lahko "služi vojaški" ali "ne služijo v vojski." To bom imenoval pogoje zdravljenja in nadzora, in napisal bom \(W_i = 1\) če je oseba \(i\) je v pogojih zdravljenja in \(W_i = 0\) če je oseba \(i\) v stanju nadzora. Končno so potencialni rezultati nekoliko bolj konceptualno težki, ker vključujejo "potencialne" rezultate; stvari, ki bi se lahko zgodile. Za vsako osebo, ki je upravičena do osnutka leta 1970, si lahko predstavljamo znesek, ki bi ga zaslužili leta 1978, če so služili v vojski, kar bom poklical \(Y_i(1)\) in znesek, ki bi ga zaslužili 1978, če niso služili v vojski, kar bom poklical \(Y_i(0)\) . V potencialnih \(Y_i(1)\) okvirih velja, da sta \(Y_i(1)\) in \(Y_i(0)\) določena količina, medtem ko je \(W_i\) naključna spremenljivka.
Izbira enot, zdravljenja in izidov je ključnega pomena, ker opredeljuje, kaj se lahko naučijo iz študije. Izbira enot - ljudi, ki so upravičeni do osnutka leta 1970, ne vključujejo žensk, zato brez dodatnih predpostavk ta študija ne bo povedala ničesar o učinkih vojaške službe na ženske. Pomembno je tudi, kako opredeliti zdravljenje in rezultate. Ali je treba obravnavanje obresti osredotočiti na služenje vojaškega roka ali borbo? Če je izid obresti zaslužek ali zadovoljstvo z delom? Navsezadnje bi morala izbira enot, zdravljenja in rezultatov temeljiti na znanstvenih in političnih ciljih študije.
Glede na izbiro enot, zdravljenja in možnih rezultatov je vzročni učinek zdravljenja na osebo \(i\) , \(\tau_i\) ,
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Z drugimi besedami, primerjamo, koliko bi oseba \(i\) zaslužil po tem, ko bi služil, koliko oseb bi si \(i\) Meni, ekv. 2.1 je najjasnejši način za opredelitev vzročnega učinka in čeprav je zelo enostaven, se ta okvir izkaže na splošno pomemben in zanimiv način (Imbens and Rubin 2015) .
Pri uporabi potencialnih rezultatov pogosto menim, da je koristno, da napišete tabelo, ki prikazuje možne rezultate in učinke zdravljenja za vse enote (tabela 2.5). Če za svojo študijo ne morete predstavljati takšne tabele, potem boste morda morali biti natančnejši v svojih definicijah vaših enot, zdravljenja in možnih izidov.
Oseba | Zaslužek v stanju zdravljenja | Zaslužek v stanju nadzora | Učinek zdravljenja |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Pomeni | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Vendar pri določanju vzročnega učinka na ta način naletimo na težavo. V skoraj vseh primerih ne opazujemo obeh potencialnih rezultatov. To pomeni, da je določena oseba služila ali ni služila. Zato opazujemo enega od potencialnih rezultatov - \(Y_i(1)\) ali \(Y_i(0)\) vendar ne oboje. Nezmožnost opazovanja obeh potencialnih rezultatov je tako velik problem, ki ga je Holland (1986) imenoval temeljni problem vzročne zveze .
Na srečo, ko delamo raziskave, nimamo samo ene osebe; namesto tega imamo veliko ljudi, kar ponuja pot okoli temeljnega problema vzročne zveze. Namesto da bi poskušali oceniti učinek zdravljenja na posamezni ravni, lahko ocenimo povprečni učinek zdravljenja za vse enote:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Ta enačba je še vedno izražena z izrazoma \(\tau_i\) , ki jih ni mogoče opazovati, vendar z neko algebro (eq 2,8 Gerber and Green (2012) ) dobimo
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
To kaže, da če lahko ocenimo povprečni rezultat populacije pod zdravljenjem ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) in populacijski povprečni izid pod nadzorom ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), nato pa lahko ocenimo povprečni učinek zdravljenja tudi brez ocene učinka zdravljenja za posamezno osebo.
Zdaj, ko sem opredelil naše ocene in stvari, ki jih skušamo oceniti, se obrnem na to, kako lahko dejansko ocenimo podatke. In tu se neposredno spopadamo s problemom, da le opazujemo enega od potencialnih rezultatov za vsako osebo; vidimo bodisi \(Y_i(0)\) ali \(Y_i(1)\) (tabela 2.6). Ocenili smo povprečni učinek zdravljenja s primerjavo zaslužkov ljudi, ki so služili za zaslužke ljudi, ki niso služili:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
kjer sta \(N_t\) in \(N_c\) število ljudi v pogojih zdravljenja in nadzora. Ta pristop bo dobro deloval, če je dodelitev zdravljenja neodvisna od morebitnih rezultatov, kar je včasih tudi neuporabnost . Na žalost, v odsotnosti eksperimenta, pogostost neuporabnosti ni pogosto izpolnjena, kar pomeni, da je ocenjevalec v ekv. 2.4 verjetno ne bo pripravil dobre ocene. Eden od načinov razmišljanja o tem je, da v odsotnosti naključne dodelitve zdravljenja, ekv. 2.4 se ne primerja s podobnimi; primerja zaslužek različnih vrst ljudi. Ali pa se izrazi nekoliko drugače, brez naključnega dodeljevanja zdravljenja, je dodelitev zdravljenja verjetno povezana s potencialnimi rezultati.
V 4. poglavju bom opisal, kako lahko randomizirani kontrolirani poskusi pomagajo raziskovalcem, da pripravijo vzročne ocene, in tukaj bom opisal, kako lahko raziskovalci izkoristijo naravne eksperimente, kot je osnutek loterije.
Oseba | Zaslužek v stanju zdravljenja | Zaslužek v stanju nadzora | Učinek zdravljenja |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Pomeni | ? | ? | ? |
Naravni eksperimenti
Eden od načinov, kako narediti vzročne ocene brez izvajanja preizkusa, je iskati nekaj, kar se dogaja v svetu, ki je naključno dodelilo zdravljenje za vas. Ta pristop imenujemo naravne eksperimente . V mnogih situacijah, žal, narava naključno ne prinaša zdravljenja, ki ga želite zanimivi populaciji. Včasih pa narava naključno prenaša povezano zdravljenje. Zlasti bom preučil primer, v katerem je sekundarno zdravljenje, ki spodbuja ljudi k primarnemu zdravljenju . Na primer, osnutek bi se lahko štel za naključno dodeljeno sekundarno zdravljenje, ki je spodbudilo nekatere ljudi, da opravijo primarno zdravljenje, ki je služilo v vojski. Ta zasnova je včasih imenovana spodbuda . Analizna metoda, ki jo bom opisal za obravnavo te situacije, se včasih imenuje instrumentalna spremenljivka . V tej nastavitvi lahko raziskovalci z nekaterimi predpostavkami spodbujajo učenje o učinkih primarnega zdravljenja za določeno podskupino enot.
Za obvladovanje dveh različnih načinov zdravljenja - spodbujanja in primarnega zdravljenja - potrebujemo nekaj novih zapisov. Recimo, da so nekateri ljudje naključno napisani ( \(Z_i = 1\) ) ali pa niso pripravljeni ( \(Z_i = 0\) ); v tem primeru se \(Z_i\) včasih imenuje instrument .
Med tistimi, ki so bili pripravljeni, so nekateri služili ( \(Z_i = 1, W_i = 1\) ) in nekateri niso ( \(Z_i = 1, W_i = 0\) ). Tudi med tistimi, ki niso bili pripravljeni, so nekateri služili ( \(Z_i = 0, W_i = 1\) ) in nekateri niso ( \(Z_i = 0, W_i = 0\) ). Potencialne rezultate za vsako osebo je zdaj mogoče razširiti, da bi pokazali svoj status tako za spodbujanje kot za zdravljenje. Na primer, naj bo \(Y(1, W_i(1))\) zaslužek osebe \(i\) če je bil sestavljen, če je \(W_i(1)\) njegov status storitve, če je sestavljen. Poleg tega lahko populacijo razdelimo v štiri skupine: komplementarje, nikogar, odklonilce in vedno udeležence (tabela 2.7).
Tip | Storitev, če je pripravljena | Storitev, če ni napisana |
---|---|---|
Compliers | Da, \(W_i(Z_i=1) = 1\) | Ne, \(W_i(Z_i=0) = 0\) |
Nikoli ne | Ne, \(W_i(Z_i=1) = 0\) | Ne, \(W_i(Z_i=0) = 0\) |
Defiers | Ne, \(W_i(Z_i=1) = 0\) | Da, \(W_i(Z_i=0) = 1\) |
Vedno | Da, \(W_i(Z_i=1) = 1\) | Da, \(W_i(Z_i=0) = 1\) |
Preden razpravljamo o oceni učinka zdravljenja (tj. Vojaške službe), lahko najprej opredelimo dva učinka spodbude (tj. Priprava). Najprej lahko opredelimo učinek spodbude na primarno zdravljenje. Drugič, lahko določimo učinek spodbude na izid. Izkazalo se bo, da se ti dve učinki lahko združita, da se zagotovi ocena učinka zdravljenja na določeno skupino ljudi.
Prvič, učinek spodbujanja na zdravljenje je mogoče opredeliti za osebo \(i\) kot
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Poleg tega se lahko ta količina določi glede na celotno populacijo kot
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Končno lahko ocenimo \(\text{ITT} _{W}\) z uporabo podatkov:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
kjer je \(\bar{W}^{\text{obs}}_1\) opazovana stopnja zdravljenja za tiste, ki so bili spodbujeni in \(\bar{W}^{\text{obs}}_0\) opazovana stopnja zdravljenja za tiste, ki niso bili spodbujani. \(\text{ITT}_W\) se včasih imenuje tudi stopnja privzema .
Nato lahko učinek spodbude na izid določimo za osebo \(i\) kot:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Poleg tega se lahko ta količina določi glede na celotno populacijo kot
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Končno lahko ocenimo \(\text{ITT}_{Y}\) z uporabo podatkov:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
kjer je \(\bar{Y}^{\text{obs}}_1\) opazen izid (npr. zaslužek) za tiste, ki so bili spodbujeni (npr. pripravljeni) in \(\bar{W}^{\text{obs}}_0\) je opazen izid za tiste, ki niso bili spodbujani.
Nazadnje, usmerimo pozornost na učinek zanimanja: učinek primarnega zdravljenja (npr. Vojaška služba) na izid (npr. Zaslužek). Na žalost se izkaže, da na splošno ne moremo oceniti tega učinka na vse enote. Vendar pa lahko z nekaterimi predpostavkami raziskovalci ocenijo učinek zdravljenja na potrošnike (tj. Osebe, ki bodo služile, če bodo pripravljene, in osebe, ki ne bodo služile, če niso pripravljene, tabela 2.7). Tem ocenam bom poklical povišan povprečni vzročni učinek (CACE) (ki se včasih imenuje tudi lokalni povprečni učinek zdravljenja , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
kjer \(G_i\) donira skupino oseb \(i\) (glejte tabelo 2.7) in \(N_{\text{co}}\) število šifer. Z drugimi besedami, ekv. 2.11 primerja zaslužek skladateljev, ki so sestavljeni \(Y_i(1, W_i(1))\) in niso napisani \(Y_i(0, W_i(0))\) . Ocene v ekv. 2.11 se zdi težko oceniti iz opaženih podatkov, ker ni mogoče identificirati komajatorjev z uporabo le opaženih podatkov (če želite vedeti, ali je nekdo bolj kompliciran, boste morali opazovati, ali je služil, ko je bil pripravljen in ali je bil vročen, ko ni bil pripravljen).
Izkazalo se je - nekoliko presenetljivo - da če obstajajo nekateri sogovorniki, potem če ima ena tri dodatne predpostavke, je mogoče oceniti CACE iz opaženih podatkov. Najprej moramo domnevati, da je dodelitev zdravljenja naključna. V primeru osnutka loterije je to razumno. Vendar pa je v nekaterih okoliščinah, kjer se naravni poskusi ne zanašajo na fizično randomizacijo, ta predpostavka lahko bolj problematična. Drugič, moramo domnevati, da nima nobenih pomanjkljivosti (ta predpostavka se včasih imenuje tudi predpostavka monotonosti). V kontekstu osnutka se zdi razumno domnevati, da je zelo malo ljudi, ki ne bodo služili, če bodo pripravljeni in bodo služili, če ne bodo pripravljeni. Tretje in končno pride najpomembnejša predpostavka, ki se imenuje omejitev izključitve . V skladu z omejitvami izključitve je treba domnevati, da se celoten učinek dodeljevanja zdravljenja prenese s samim zdravljenjem. Z drugimi besedami, moramo domnevati, da ni neposrednega učinka spodbujanja na rezultate. V primeru osnutka loterije je treba na primer domnevati, da osnutek statusa ne vpliva na dohodke, razen v služenje vojaškega roka (slika 2.11). Omejitev izključitve bi lahko bila kršena, če bi na primer ljudje, ki so bili pripravljeni, v šoli preživeli več časa, da bi se izognili služenju ali če bi manj verjetno delali ljudje, ki so bili pripravljeni.
Če so izpolnjeni ti trije pogoji (naključna dodelitev zdravljenju, brez pomanjkljivosti in omejitev izključitve), potem
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
zato lahko ocenimo CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Eden od načinov razmišljanja o CACE je, da je razlika med tistimi, ki so bili spodbujeni in tistimi, ki niso spodbujene, napolnjena z napetostjo.
Obstajata dve pomembni opozorili, ki jih je treba upoštevati. Prvič, omejitev izključitve je velika predpostavka in jo je treba utemeljiti od primera do primera, ki pogosto zahteva strokovno znanje s področja področja. Omejitev izključitve ni mogoče utemeljiti z naključnim vzpodbujanjem. Drugič, skupni praktični izziv pri analizi instrumentalne spremenljivke prihaja, kadar spodbuda na učinek zdravljenja le malo vpliva (kadar je \(\text{ITT}_W\) majhen). To se imenuje šibek instrument in vodi do različnih problemov (Imbens and Rosenbaum 2005; Murray 2006) . Eden od načinov razmišljanja o problemu s šibkimi instrumenti je, da je \(\widehat{\text{CACE}}\) lahko občutljiv na majhne pristranskosti v \(\widehat{\text{ITT}_Y}\) kršitve omejitve izključitve, ker se te pristranskosti povečajo z majhnim \(\widehat{\text{ITT}_W}\) (glej 2.13). Približno, če zdravljenje, ki ga dodeljuje narava, nima velikega vpliva na zdravljenje, ki vas skrbi, potem se boste težko naučili o zdravljenju, ki vas zanima.
Glej poglavji 23 in 24 iz Imbens and Rubin (2015) za bolj formalno različico te razprave. Tradicionalni ekonometrični pristop k instrumentalnim spremenljivkam je običajno izražen v smislu ocenjevanja enačb, ne potencialnih rezultatov. Za uvod iz te druge perspektive glej Angrist and Pischke (2009) in za primerjavo med obema pristopoma glej oddelek 24.6 Imbens and Rubin (2015) . Alternativna, nekoliko manj formalna predstavitev pristopa instrumentalnih spremenljivk je podana v poglavju 6 Gerber and Green (2012) . Za več o omejitvi izključitve glej D. Jones (2015) . Aronow and Carnegie (2013) opisujeta še dodaten niz predpostavk, ki se lahko uporabijo za oceno ATE namesto CACE. Za več o tem, kako lahko naravni poskusi zelo težko razlagajo, glej Sekhon and Titiunik (2012) . Za bolj splošen uvod v naravne eksperimente - tisti, ki presega zgolj instrumentalni spremenljivki, vključujejo tudi modele, kot je diskretnost regresije - glej Dunning (2012) .