Šajā papildinājumā es apkopošu dažas idejas par cēloņsakarību izdarīšanu no neeksperimentāliem datiem nedaudz matemātiskā formā. Pastāv divas galvenās pieejas: cēloņu grafu sistēma, kas visvairāk ir saistīta ar Judea Pearl un kolēģiem, un potenciālo rezultātu struktūra, kas visvairāk ir saistīta ar Donaldu Rubinu un kolēģiem. Es iepazīstināšu ar potenciālo rezultātu sistēmu, jo tā ir ciešāk saistīta ar idejām matemātiskajās piezīmēs 3. un 4. nodaļas beigās. Lai iegūtu vairāk informācijas par cēloņu grafiku sistēmu, iesaku Pearl, Glymour, and Jewell (2016) (ievadvārdi ) un Pearl (2009) (uzlabotas). Lai ieteiktu cēloņsakarību, kas apvienotu potenciālo rezultātu struktūru un cēloņsakarību struktūru, es ieteiktu Morgan and Winship (2014) .
Šī papildinājuma mērķis ir palīdzēt jums iepazīt potenciālo rezultātu tradīciju apzīmējumu un stilu, lai jūs varētu pāriet uz kādu no vairāk tehniskajiem materiāliem, kas uzrakstīti šajā tēmā. Pirmkārt, es raksturošu potenciālo rezultātu sistēmu. Tad es to izmantošu, lai tālāk apspriestu dabas eksperimentus, piemēram, Angrist (1990) par militārā dienesta ietekmi uz ienākumiem. Šis pielikums lielā mērā balstās uz Imbens and Rubin (2015) .
Potenciālo rezultātu sistēma
Potenciālajiem rezultātu sistēmai ir trīs galvenie elementi: vienības , ārstēšana un iespējamie rezultāti . Lai ilustrētu šos elementus, pieņemsim uz jautājumu par stilizētu versiju Angrist (1990) : Kāda ir militārā dienesta ietekme uz ienākumiem? Šajā gadījumā mēs varam noteikt vienības , kuras ASV ir atļautas 1970. gada projektā, un mēs varam indeksēt šos cilvēkus ar \(i = 1, \ldots, N\) . Šajā gadījumā ārstēšana var būt "kalpo militārajā" vai "nedarbojas militārajā". Es \(W_i = 1\) par ārstēšanas un kontroles nosacījumiem, un es rakstīšu \(W_i = 1\) ja personai \(i\) ir ārstēšanas stāvoklī un \(W_i = 0\) ja persona \(i\) atrodas kontroles stāvoklī. Visbeidzot, potenciālie rezultāti ir mazliet konceptuāli grūti, jo tie ietver "potenciālos" rezultātus; lietas, kas varētu notikt. Katrai personai, kas atbilst 1970. gada likumprojektam, mēs varam iedomāties summu, kādu viņi būtu nopelnījuši 1978. gadā, ja tie darbosies militārajā jomā, ko es zvanu \(Y_i(1)\) un summu, ko viņi būtu nopelnījuši 1978.gadā, ja viņi nekalpotu militārā \(Y_i(0)\) , ko es zvanu \(Y_i(0)\) . Potenciālo rezultātu sistēmā \(Y_i(1)\) un \(Y_i(0)\) tiek uzskatīti par fiksētiem daudzumiem, bet \(W_i\) ir nejaušs mainīgais.
Vienību, ārstēšanas un rezultātu izvēle ir kritiska, jo tā definē to, ko var un nevar mācīties no pētījuma. Izvēloties vienības - cilvēkus, kuri ir tiesīgi uz 1970. gada projektu - neietver sievietes, un tāpēc bez papildu pieņēmumiem šis pētījums mums neko nedos par militārā dienesta ietekmi uz sievietēm. Svarīgi ir arī lēmumi par ārstēšanas un rezultātu definēšanu. Piemēram, vai interešu attieksme būtu jākoncentrējas uz militāro darbību vai apkarošanu? Vai procentu rezultāts ir peļņa vai apmierinātība ar darbu? Galu galā vienību, ārstēšanas un rezultātu izvēles pamatā jābūt pētījuma zinātniskajiem un politikas mērķiem.
Ņemot vērā vienību izvēli, ārstēšanu un potenciālos rezultātus, ārstēšanas cēloņsakarība uz cilvēkiem \(i\) , \(\tau_i\) , ir
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Citiem vārdiem sakot, mēs salīdzinām, cik daudz persona \(i\) būtu nopelnījusi pēc kalpošanas, cik daudz persona \(i\) būtu nopelnījusi bez apkalpošanas. Man, eq. 2.1 ir visskaidrākais veids, kā definēt cēloņspēju, un, lai gan tas ir ļoti vienkārši, šis saturs daudzos nozīmīgos un interesantos veidos (Imbens and Rubin 2015) vispārēji (Imbens and Rubin 2015) .
Izmantojot potenciālo rezultātu sistēmu, man bieži ir lietderīgi izrakstīt tabulu, kurā ir parādīti potenciālie rezultāti un ārstēšanas efekti attiecībā uz visām vienībām (2.5. Tabula). Ja jūs nevarat iedomāties šādu tabulu savam pētījumam, jums, iespējams, jābūt precīzākam jūsu vienību definīcijās, ārstēšanas metodēs un potenciālajos rezultātos.
Persona | Ienākumi ārstēšanas stāvoklī | Ieņēmumi kontroles stāvoklī | Ārstēšanas efekts |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Vidējais | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Tomēr, nosakot cēloņsakarību, mēs sastopamies ar problēmu. Gandrīz visos gadījumos mēs nespējam ievērot abus potenciālos rezultātus. Tas ir, konkrēta persona, kas kalpoja vai kalpoja. Tāpēc mēs novērojam vienu no potenciālajiem rezultātiem - \(Y_i(1)\) vai \(Y_i(0)\) ne abi. Nevar sasniegt abus potenciālos rezultātus, ir tāda liela problēma, ka Holland (1986) sauc par primāro secinājumu fundamentālo problēmu .
Par laimi, kad mēs veicam pētniecību, mums ne tikai ir viena persona; Drīzāk mums ir daudz cilvēku, un tas piedāvā ceļu pie fundamentālām problēmām, kas saistītas ar cēloņsakarību. Tā vietā, lai mēģinātu novērtēt individuālā līmeņa ārstēšanas efektu, mēs varam novērtēt vidējo ārstēšanas efektu visām vienībām:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Šis vienādojums joprojām tiek izteikts ar \(\tau_i\) , kas nav \(\tau_i\) , bet ar dažiem \(\tau_i\) ( Gerber and Green (2012) eq 2.8), mēs iegūstam
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Tas parāda, ka, ja mēs varam novērtēt iedzīvotāju vidējo iznākumu ārstēšanas laikā ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) un populācijas vidējo iznākumu kontrolē ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), tad mēs varam novērtēt vidējo ārstēšanas efektu, pat neņemot vērā ārstēšanas efektu konkrētai personai.
Tagad, kad esmu definējis mūsu novērtējumu - to, ko mēs cenšamies novērtēt - es vēršos pie tā, kā mēs to faktiski varam novērtēt ar datiem. Un šeit mēs tieši saskaramies ar problēmu, ka mēs novērojam tikai vienu no potenciālajiem rezultātiem katrai personai; mēs redzam vai nu \(Y_i(0)\) vai \(Y_i(1)\) (tabula 2.6). Mēs varētu novērtēt vidējo ārstēšanas efektu, salīdzinot to cilvēku ieņēmumus, kuri kalpoja to cilvēku ienākumiem, kuri netika izmantoti:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
kur \(N_t\) un \(N_c\) ir cilvēku skaits apstrādes un kontroles apstākļos. Šī pieeja labi darbosies, ja ārstēšanas uzdevums nav atkarīgs no potenciālajiem rezultātiem, un to dažkārt sauc par ignorability . Diemžēl eksperimenta trūkuma gadījumā ignorējamība bieži vien nav apmierinoša, kas nozīmē, ka novērtējums eq. 2.4, visticamāk, nesniegs labu aplēsi. Viens no veidiem, kā domāt par to, ir tas, ka, ja nav izlases veida ārstēšanas, eq. 2.4 nav salīdzinājumā ar līdzīgu; tas salīdzina dažāda veida cilvēku ienākumus. Vai izteikts nedaudz atšķirīgs, bez izlases piešķiršanas ārstēšanas, ārstēšanas sadalījums, iespējams, ir saistīts ar iespējamiem rezultātiem.
4. nodaļā es aprakstīšu, kā randomizēti kontrolētie eksperimenti var palīdzēt pētniekiem veikt cēloņsakarības, un šeit es raksturoju, kā pētnieki var izmantot dabas eksperimentus, piemēram, loterijas projektu.
Persona | Ienākumi ārstēšanas stāvoklī | Ieņēmumi kontroles stāvoklī | Ārstēšanas efekts |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Vidējais | ? | ? | ? |
Dabiskie eksperimenti
Viena pieeja, lai veiktu cēloņu aplēses bez eksperimenta uzsākšanas, ir meklēt kaut ko tādu, kas notiek pasaulē, kurš jums nejauši izvēlējies ārstēšanu. Šo pieeju sauc par dabas eksperimentiem . Diemžēl dabā daudzās situācijās nejauši netiek sniegta attieksme, kādu vēlaties interesējošiem iedzīvotājiem. Bet dažreiz daba nejauši nodrošina ar to saistītu ārstēšanu. Jo īpaši es izskatīšu gadījumu, kad ir kāda sekundārā ārstēšana, kas mudina cilvēkus saņemt primāro ārstēšanu . Piemēram, projektu var uzskatīt par nejauši izvēlētu sekundāro ārstēšanu, kas mudināja dažus cilvēkus veikt primāro ārstēšanu, kas kalpoja militārajā jomā. Šo dizainu dažreiz sauc par iedrošinājuma dizainu . Un analīzes metode, ko es raksturojošu, lai apstrādātu šo situāciju, dažreiz tiek dēvēta par instrumentālajiem mainīgajiem lielumiem . Šajā noteikumā ar dažiem pieņēmumiem pētnieki var izmantot iedrošinājumu, lai uzzinātu par primārās terapijas ietekmi uz konkrētu vienību apakškopu.
Lai varētu rīkoties ar divām atšķirīgām procedūrām - iedrošinājumu un primāro ārstēšanu, mums ir vajadzīgas jaunas norādes. Pieņemsim, ka daži cilvēki ir nejauši izveidoti ( \(Z_i = 1\) ) vai nav sastādīti ( \(Z_i = 0\) ); Šajā situācijā \(Z_i\) dažreiz tiek saukts par instrumentu .
Starp tiem, kas bija sagatavoti, daži pasniedza ( \(Z_i = 1, W_i = 1\) ), un daži nav ( \(Z_i = 1, W_i = 0\) ). Tāpat starp tiem, kuri nebija sastādīti, daži tika pasniegti ( \(Z_i = 0, W_i = 1\) ), un daži to nedarīja ( \(Z_i = 0, W_i = 0\) ). Tagad potenciālie rezultāti katrai personai var tikt paplašināti, lai parādītu savu statusu gan iedrošināšanai, gan ārstēšanai. Piemēram, let \(Y(1, W_i(1))\) ir personas \(i\) ieņēmumi, ja viņš ir sagatavots, kur \(W_i(1)\) ir viņa pakalpojuma statuss, ja tas ir sagatavots. Turklāt mēs varam sadalīt iedzīvotājus četrās grupās: komplimenti, nekad-takers, aizstāvji un vienmēr-takers (2.7. Tabula).
Tips | Pakalpojums, ja tas ir sagatavots | Pakalpojums, ja tas nav sagatavots |
---|---|---|
Komplekti | Jā, \(W_i(Z_i=1) = 1\) | Nē, \(W_i(Z_i=0) = 0\) |
Nekad-takers | Nē, \(W_i(Z_i=1) = 0\) | Nē, \(W_i(Z_i=0) = 0\) |
Aizsargi | Nē, \(W_i(Z_i=1) = 0\) | Jā, \(W_i(Z_i=0) = 1\) |
Vienmērēji | Jā, \(W_i(Z_i=1) = 1\) | Jā, \(W_i(Z_i=0) = 1\) |
Pirms mēs apspriežam ārstēšanas ietekmes novērtējumu (ti, militāro dienestu), vispirms mēs varam noteikt divus iedrošināšanas (ti, izstrādāšanas) efektus. Pirmkārt, mēs varam definēt stimulu ietekmi uz primāro ārstēšanu. Otrkārt, mēs varam definēt, kā sekmēt rezultātu. Izrādīsies, ka šos divus efektus var apvienot, lai sniegtu aptuvenu ārstēšanas rezultātu konkrētai cilvēku grupai.
Pirmkārt, ārstēšanas iedrošināšanas efektu var definēt personai \(i\) as
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Turklāt šo daudzumu var definēt visā populācijā kā
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Visbeidzot, mēs varam novērtēt \(\text{ITT} _{W}\) izmantojot datus:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
kur \(\bar{W}^{\text{obs}}_1\) ir novērotais ārstēšanas ātrums tiem, kas tika iedrošināti, un \(\bar{W}^{\text{obs}}_0\) novērotais ārstēšanas ātrums tiem, kuri netika aicināti. \(\text{ITT}_W\) dažreiz sauc arī par uzņemšanas līmeni .
Tālāk, rezultāta iedrošināšanas efektu var definēt personai \(i\) kā:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Turklāt šo daudzumu var definēt visā populācijā kā
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Visbeidzot, mēs varam novērtēt \(\text{ITT}_{Y}\) izmantojot datus:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
kur \(\bar{Y}^{\text{obs}}_1\) ir novērotais rezultāts (piemēram, ieņēmumi) tiem, kas tika iedrošināti (piemēram, izstrādāts) un \(\bar{W}^{\text{obs}}_0\) ir novērotais rezultāts tiem, kuri netika aicināti.
Visbeidzot, mēs vēršam uzmanību uz interesējošo ietekmi: primārās ārstēšanas (piemēram, militārā dienesta) ietekme uz rezultātu (piemēram, peļņa). Diemžēl izrādās, ka vispār nevar novērtēt šo ietekmi uz visām vienībām. Tomēr, balstoties uz dažiem pieņēmumiem, pētnieki var novērtēt ārstēšanas ietekmi uz komplikatoriem (ti, cilvēkiem, kuri kalpo, ja tos sagatavo, un cilvēkiem, kuri nelietos, ja tie nav sagatavoti, 2.7. Tabula). Es saucu šo novērtējumu par vidējo cēloņsakarības efektu (CACE) (kuru dažkārt sauc arī par vietējo vidējo ārstēšanas efektu LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
kur \(G_i\) ziedo personu grupu \(i\) (sk. 2.7. tabulu) un \(N_{\text{co}}\) ir kompilatoru skaits. Citiem vārdiem sakot, eq. 2.11 salīdzina programmētāju ieņēmumus, kuri tiek sastādīti \(Y_i(1, W_i(1))\) un nav sastādīti \(Y_i(0, W_i(0))\) . Aptuvenais ekv. 2.11 šķiet grūti novērtēt no novērotajiem datiem, jo nav iespējams identificēt komplimatorus, kas izmanto tikai novērotos datus (lai uzzinātu, vai kāds ir sūdzības iesniedzējs, jums būtu jāievēro, vai viņš ir izsniegts, kad tas ir sagatavots, un vai viņš to izsniedz, kad tas nav sagatavots).
Izrādās, nedaudz pārsteidzoši - ka, ja ir kādi komplimenti, tad, ja viens no tiem izvirza trīs papildu pieņēmumus, ir iespējams novērtēt CACE no novērotajiem datiem. Pirmkārt, ir jāpieņem, ka piešķiršana ārstēšanai ir nejauša. Izlozes projektu gadījumā tas ir pamatots. Tomēr dažos gadījumos, kad dabas eksperimenti nebalstās uz fizisku nejaušību, šis pieņēmums var būt problemātisks. Otrkārt, ir jāpieņem, ka viņu nav pretinieku (šo pieņēmumu dažkārt sauc arī par monotonitātes pieņēmumu). Projekta kontekstā šķiet saprātīgi pieņemt, ka ir ļoti maz cilvēku, kuri netiks kalpoti, ja tie tiks izstrādāti un kalpo, ja tie nav sagatavoti. Treškārt, visbeidzot, ir vissvarīgākais pieņēmums, ko sauc par izslēgšanas ierobežojumu . Saskaņā ar izslēgšanas ierobežojumu, ir jāpieņem, ka visa ārstēšanas piešķiršanas ietekme tiek nodota ar pašu ārstēšanu. Citiem vārdiem sakot, ir jāpieņem, ka nav tiešas ietekmes uz rezultātu veicināšanu. Piemēram, loterijas projektam jāpieņem, ka statusa projekts neietekmē ienākumus, kas nav militārā dienesta dēļ (2.11. Attēls). Izslēgšanas ierobežojumu var pārkāpt, ja, piemēram, cilvēki, kas tika sagatavoti, pavadīja vairāk laika skolā, lai izvairītos no pakalpojumu sniegšanas, vai arī, ja darba devēji mazāk pieņemtu darbā cilvēkus, kuri tika sagatavoti.
Ja šie trīs nosacījumi (izlases veida piešķiršana ārstēšanai, preteineru izslēgšana un izslēgšanas ierobežojums) nav izpildīti, tad
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
tāpēc mēs varam novērtēt CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Viens no veidiem, kā domāt par CACE, ir tas, ka rezultātu atšķirība ir starp tiem, kas tika iedrošināti, un tiem, kurus neveicina, palielinot to uzņemšanas līmeni.
Ir jāievēro divi svarīgi brīdinājumi. Pirmkārt, izslēgšanas ierobežojums ir stingrs pieņēmums, un tas ir jāpamato katrā gadījumā atsevišķi, un tas bieži vien prasa speciālo zināšanu jomās. Izslēgšanas ierobežojumu nevar pamatot ar iedalījuma nejaušināšanu. Otrkārt, kopīgs praktisks izaicinājums ar instrumentālo mainīgo analīzi rodas tad, kad iedrošinājums maz veicina ārstēšanas apgūšanu (ja \(\text{ITT}_W\) ir mazs). To sauc par vāju instrumentu , un tas izraisa dažādas problēmas (Imbens and Rosenbaum 2005; Murray 2006) . Viens no veidiem, kā domāt par problēmu ar vājiem instrumentiem ir tas, ka \(\widehat{\text{CACE}}\) var būt jutīgs pret nelielām novirzēm \(\widehat{\text{ITT}_Y}\) potenciāli dēļ izslēgšanas ierobežojuma pārkāpumi, jo šos aizspriedumus palielina neliels \(\widehat{\text{ITT}_W}\) (sk. 2.13. kritēriju). Aptuveni, ja ārstniecībai, kuru piešķir daba, nav lielas ietekmes uz ārstēšanu, par kuru jūs rūpējies, tad jums būs grūti mācīties par ārstēšanu, kas jums rūpējas.
Imbens and Rubin (2015) 23. un 24. nodaļa Imbens and Rubin (2015) par šīs diskusijas formālāku versiju. Tradicionālā ekonometriskā pieeja instrumentālajiem mainīgajiem parasti tiek izteikta ar vienādojumu aplēsēm, nevis potenciālajiem rezultātiem. Ievads no šīs citas perspektīvas skat. Angrist and Pischke (2009) , un, lai salīdzinātu šīs divas pieejas, sk. Imbens and Rubin (2015) 24.6. Imbens and Rubin (2015) . Alternatīvs, nedaudz neakcentatīvāks instrumentālo mainīgo lieluma pieejas apraksts ir sniegts Gerber and Green (2012) . Gerber and Green (2012) 6. nodaļā. Plašāku informāciju par izslēgšanas ierobežojumu skatiet D. Jones (2015) . Aronow and Carnegie (2013) apraksta papildu pieņēmumu kopumu, kurus var izmantot, lai novērtētu ATE, nevis CACE. Sekhon and Titiunik (2012) par to, kā dabas eksperimenti var būt ļoti grūti interpretēt, skatīt Sekhon and Titiunik (2012) . Vispārīgākai dabisko eksperimentu ievadei, kas pārsniedz tikai instrumentālo mainīgo pieeju, jāietver arī tādi modeļi kā regresijas pārtraukšana (skat. Dunning (2012) .