U ovom dodatku prikazat ću neke ideje o kauzalnom zaključivanju iz ne-eksperimentalnih podataka u malo više matematičkom obliku. Postoje dva glavna pristupa: okosni grafikonski okvir, koji je najviše povezan s Judea Pearl i suradnicima, te potencijalni ishodički okvir, najčešće povezan s Donaldom Rubinom i kolegama. Uvest ću potencijalni ishodišni okvir jer je usko povezan s idejama u matematičkim bilješkama na kraju poglavlja 3 i 4. Za više o okviru kauzalnih grafova preporučujem Pearl, Glymour, and Jewell (2016) (uvodni ) i Pearl (2009) (napredno). Za knjigovodstvenu obradu kauzalnog zaključka koji objedinjuje potencijalne ishode i okosni grafikonski okvir, preporučujem Morgan and Winship (2014) .
Cilj ovog priloga je da vam pomogne da se uklopite u znak i stil potencijalne tradicije ishoda kako biste se mogli prebaciti na neki od tehničkih materijala napisan na ovoj temi. Prvo ću opisati okvir potencijalnih ishoda. Zatim ću ga koristiti za daljnje raspravljanje o prirodnim eksperimentima kao što je Angrist (1990) o učincima vojne službe na zaradu. Ovaj se dodatak jako oslanja na Imbens and Rubin (2015) .
Potencijalni rezultati
Okvir potencijalnih ishoda ima tri glavna elementa: jedinice , tretmani i potencijalni ishodi . Da bismo ilustrirali ove elemente, razmislimo o stiliziranoj verziji pitanja Angrist (1990) : Kakav je učinak vojne službe na zaradu? U tom slučaju možemo definirati jedinice koje bi mogle biti ljudi koji ispunjavaju uvjete za nacrt 1970. godine u Sjedinjenim Američkim Državama, a možemo ih indeksirati pomoću \(i = 1, \ldots, N\) . Liječenje u ovom slučaju može biti "služenje u vojsci" ili "ne služiti u vojsci." Nazvat ću ove uvjete liječenja i kontrole, a ja ću napisati \(W_i = 1\) ako osoba \(i\) je u stanju liječenja i \(W_i = 0\) ako je osoba \(i\) u kontrolnom stanju. Konačno, potencijalni ishodi bitno su konceptualno teški jer uključuju "potencijalne" ishode; stvari koje su se mogle dogoditi. Za svaku osobu koja ispunjava uvjete za nacrt iz 1970. godine, možemo zamisliti iznos koji bi oni zaradili 1978., ako su služili u vojsci, koju ću nazvati \(Y_i(1)\) i iznos koji bi oni zaradili u 1978 ako nisu služili u vojsci, što ću nazvati \(Y_i(0)\) . U okviru potencijala ishoda, \(Y_i(1)\) i \(Y_i(0)\) smatraju se fiksnim količinama, dok je \(W_i\) slučajna varijabla.
Izbor jedinica, tretmana i ishoda je kritičan jer definira ono što se može - i ne može - naučiti iz studije. Izbor jedinica - ljudi koji imaju pravo na nacrt 1970. - ne uključuje žene, pa bez dodatnih pretpostavki, ova studija neće nam ništa reći o učincima vojne službe na žene. Također su važne odluke o tome kako definirati tretmane i ishode. Na primjer, treba li tretiranje interesa biti usredotočeno na služenje u vojsci ili na borbu? Treba li ishod kamata biti zarada ili zadovoljstvo poslom? Konačno, izbor jedinica, tretmana i ishoda treba biti usmjeren znanstvenim i političkim ciljevima studije.
S obzirom na odabir jedinica, tretmana i mogućih ishoda, uzročni učinak liječenja na osobe \(i\) , \(\tau_i\) je
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Drugim riječima, usporedili smo koliko bi osoba \(i\) zaradila nakon posluživanja koliko bi osoba \(i\) zaradila bez posluživanja. Za mene, eq. 2.1 je najjasniji način definiranja kauzalnog efekta, a iako vrlo jednostavan, ovaj okvir postaje generaliziran na mnoge važne i zanimljive načine (Imbens and Rubin 2015) .
Kada koristim okvir potencijalnih ishoda, često mi je korisno napisati tablicu koja prikazuje potencijalne ishode i učinke liječenja za sve jedinice (tablica 2.5). Ako ne možete zamisliti takvu tablicu za svoju studiju, možda biste trebali biti precizniji u svojim definicijama vaših jedinica, tretmana i potencijalnih ishoda.
Osoba | Zarada u stanju liječenja | Zarada u kontrolnom stanju | Učinak liječenja |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
značiti | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Prilikom definiranja kauzalnog efekta na ovaj način, međutim, nalazimo se u problemu. U gotovo svim slučajevima ne primjećuje se oba potencijalna ishoda. To jest, određena osoba je služila ili nije služila. Zato promatramo jedan od mogućih ishoda - \(Y_i(1)\) ili \(Y_i(0)\) - ali ne oboje. Nemogućnost promatranja oba potencijalna ishoda je tako veliki problem koji je Holland (1986) nazvao temeljnim problemom kauzalnog zaključka .
Na sreću, kada radimo istraživanje, nemamo samo jednu osobu; Umjesto toga imamo mnogo ljudi, i to nudi put oko Temeljnog problema kauzalnog zaključivanja. Umjesto da pokušamo procijeniti učinak tretmana na razini pojedinca, možemo procijeniti prosječni učinak liječenja za sve jedinice:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Ova se jednadžba još uvijek izražava u smislu \(\tau_i\) , koji nisu vidljivi, ali s nekim algebrom (eq 2.8 od Gerber and Green (2012) ), dobivamo
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
To pokazuje da se, ako se može procijeniti populacije prosječne rezultate u liječenju ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), a prosječna populacija rezultat pod kontrolom ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), možemo procijeniti prosječni učinak liječenja, čak i bez procjene učinka liječenja za bilo koju osobu.
Sada kada sam definisao našu procjenu - stvar koju pokušavamo procijeniti - okrenut ću se tome kako to možemo procjenjivati s podacima. I ovdje se izravno bavimo problemom da promatramo samo jedan od mogućih ishoda za svaku osobu; vidimo ili \(Y_i(0)\) ili \(Y_i(1)\) (tablica 2.6). Procijenili smo prosječni učinak liječenja uspoređujući zaradu ljudi koji su služili zaradi ljudi koji nisu služili:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
gdje su \(N_t\) i \(N_c\) brojevi ljudi u uvjetima liječenja i kontrole. Ovaj pristup će dobro funkcionirati ako je zadatak liječenja neovisan o mogućim ishodima, a stanje se ponekad naziva ignoriranjem . Nažalost, u nedostatku eksperimenta, ignoriranje nije često zadovoljan, što znači da procjenitelj u eq. 2.4 vjerojatno neće dati dobru procjenu. Jedan od načina razmišljanja o tome je da u odsutnosti slučajnog dodjeljivanja liječenja, npr. 2.4 ne uspoređuje kao sa sličnim; uspoređuje zaradu različitih vrsta ljudi. Ili se izrazio malo drugačiji, bez slučajnog dodjeljivanja liječenja, raspodjela terapije vjerojatno je povezana s mogućim ishodima.
U četvrtom poglavlju opisujem kako randomizirani kontrolirani pokusi mogu pomoći istraživačima da uzrokuju procjene, a ovdje ću opisati kako istraživači mogu iskoristiti prirodne eksperimente, kao što je nacrt lutrije.
Osoba | Zarada u stanju liječenja | Zarada u kontrolnom stanju | Učinak liječenja |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
značiti | ? | ? | ? |
Prirodni pokusi
Jedan pristup kauzalnim procjenama bez provođenja pokusa jest tražiti nešto što se događa u svijetu koji je slučajno odredio tretman za vas. Ovaj se pristup naziva prirodnim eksperimentima . U mnogim situacijama, na žalost, priroda ne proizvede nasumično liječenje koje želi stanovništvu od interesa. Ali ponekad, priroda nasumično donosi povezan tretman. Osobito ću razmotriti slučaj gdje postoji neki sekundarni tretman koji potiče ljude da prime primarni tretman . Na primjer, nacrt bi se mogao smatrati slučajnim dodijeljenim sekundarnim postupkom koji je potaknuo neke ljude da primaju primarni tretman koji je služio u vojsci. Ovaj dizajn se ponekad naziva dizajn poticanja . A metoda analize koju ću opisati za rješavanje ove situacije ponekad se naziva instrumentalnim varijablama . U ovoj postavci, uz neke pretpostavke, istraživači mogu koristiti poticaj da uče o učinku primarne terapije za određeni podskup jedinica.
Kako bismo obradili dva različita tretmana - poticanje i primarni tretman - potrebna nam je nova notacija. Pretpostavimo da su neki ljudi nasumično izrađeni ( \(Z_i = 1\) ) ili nisu izrađeni ( \(Z_i = 0\) ); u ovoj situaciji, \(Z_i\) ponekad se naziva instrument .
Među onima koji su izrađeni, neki su služili ( \(Z_i = 1, W_i = 1\) ), a neki nisu ( \(Z_i = 1, W_i = 0\) ). Slično, među onima koji nisu bili izrađeni, neki su služili ( \(Z_i = 0, W_i = 1\) ), a neki nisu ( \(Z_i = 0, W_i = 0\) ). Potencijalni ishodi za svaku osobu sada se mogu proširiti kako bi pokazali svoj status i za ohrabrenje i tretman. Na primjer, neka \(Y(1, W_i(1))\) bude zarada osobe \(i\) ako je izrađen, gdje je \(W_i(1)\) njegov status usluge ako je izrađen. Nadalje, možemo podijeliti stanovništvo u četiri skupine: kompliers, never-takers, defiers, i uvijek-takers (tablica 2.7).
Tip | Služba ako je izrađena | Usluga ako nije izrađena |
---|---|---|
Compliers | Da, \(W_i(Z_i=1) = 1\) | Ne, \(W_i(Z_i=0) = 0\) |
Nikad ispitanicima | Ne, \(W_i(Z_i=1) = 0\) | Ne, \(W_i(Z_i=0) = 0\) |
Defiers | Ne, \(W_i(Z_i=1) = 0\) | Da, \(W_i(Z_i=0) = 1\) |
Uvijek ispitanicima | Da, \(W_i(Z_i=1) = 1\) | Da, \(W_i(Z_i=0) = 1\) |
Prije nego što razgovaramo o procjeni učinka liječenja (tj. Vojne službe), najprije možemo odrediti dva učinka poticanja (tj. Izraditi). Prvo, možemo odrediti učinak ohrabrenja na primarni tretman. Drugo, možemo odrediti učinak ohrabrenja na ishod. Ispostavit će se da se ta dva učinka mogu kombinirati kako bi se procijenila učinak liječenja na određenu skupinu ljudi.
Prvo, učinak poticanja na liječenje može se definirati za osobu \(i\) as
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Nadalje, ova se količina može definirati u cijeloj populaciji kao
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Konačno, možemo procijeniti podatke \(\text{ITT} _{W}\) pomoću podataka:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
gdje je \(\bar{W}^{\text{obs}}_1\) promatrana stopa tretmana za one koji su ohrabreni i \(\bar{W}^{\text{obs}}_0\) promatrana stopa liječenja onima koji nisu bili ohrabreni. \(\text{ITT}_W\) također se ponekad naziva i stopom unosa .
Zatim, učinak ohrabrenja na ishod može se definirati za osobu \(i\) kao:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Nadalje, ova se količina može definirati u cijeloj populaciji kao
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Konačno, možemo procijeniti \(\text{ITT}_{Y}\) pomoću podataka:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
(npr. zarade) za one koji su bili ohrabreni (npr., izrađeni) i \(\bar{W}^{\text{obs}}_0\) \(\bar{Y}^{\text{obs}}_1\) \(\bar{W}^{\text{obs}}_0\) je promatrani ishod onih koji nisu bili ohrabreni.
Konačno, skrećemo pozornost na učinak interesa: učinak primarnog liječenja (npr. Vojna služba) na ishod (npr. Zaradu). Nažalost, pokazalo se da ne može, općenito, procijeniti taj učinak na sve jedinice. Međutim, s nekim pretpostavkama, istraživači mogu procijeniti učinak liječenja na kompilera (tj. Ljudi koji će služiti ako su sastavljeni i osobe koje neće služiti ako nisu sastavljene, tablica 2.7). Nazvat ću ovu procjenu prosječni kauzalni učinak (CACE) (koji se ponekad naziva lokalni prosječni učinak liječenja , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
gdje \(G_i\) donira grupu osoba \(i\) (vidi tablicu 2.7) i \(N_{\text{co}}\) je broj kompliera. Drugim riječima, eq. 2.11 uspoređuje zaradu compliera koji su sastavljeni \(Y_i(1, W_i(1))\) i nisu izrađeni \(Y_i(0, W_i(0))\) . Procjena u eq. 2.11 čini se teško procijeniti od promatranih podataka jer nije moguće identificirati kompilere koristeći samo promatrane podatke (da biste znali je li netko kompilator trebali pratiti je li služio kada je izrađen i je li služio kada nije izrađen).
Izgleda - pomalo iznenađujuće - da, ako postoje neki komplieri, onda ako se predviđaju tri dodatne pretpostavke, moguće je procijeniti CACE od promatranih podataka. Prvo, treba pretpostaviti da je dodjeljivanje tretmana slučajno. U slučaju skice lutrije to je razumno. Međutim, u nekim postavkama gdje se prirodni pokusi ne oslanjaju na fizičku randomizaciju, ova pretpostavka može biti problematičnija. Drugo, treba pretpostaviti da njihovi ne predstavljaju defier (ta se pretpostavka također ponekad zove monotoničnost). U kontekstu nacrta, čini se razumnim pretpostaviti da postoji vrlo malo ljudi koji neće služiti ako su izrađeni i da će služiti ako nisu sastavljeni. Treće, i na kraju, dolazi najvažnija pretpostavka koja se zove ograničenje isključenja . Pod ograničenjem isključenja valja pretpostaviti da se cijeli učinak dodjele tretmana prolazi kroz sam tretman. Drugim riječima, treba pretpostaviti da nema izravnog učinka poticanja na ishode. U slučaju nacrta lutrije, na primjer, treba pretpostaviti da nacrt statusa nema utjecaja na zaradu osim vojne službe (slika 2.11). Ograničenje isključenja moglo bi se povrijediti ako, na primjer, ljudi koji su sastavljeni proveli više vremena u školi kako bi izbjegli uslugu ili ako poslodavci imaju manje izglede zaposliti ljude koji su sastavljeni.
Ako se zadovolje ta tri uvjeta (slučajni dodjeljivanje liječenju, bez defierova i ograničenja isključenja), tada
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
tako da možemo procijeniti CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Jedan od načina razmišljanja o CACE-u jest da je razlika u ishodima između onih koji su ohrabreni i onih koji nisu ohrabreni, napuhani stopom unosa.
Postoje dva važna upozorenja koja treba imati na umu. Prvo, ograničenje isključenja je snažna pretpostavka i treba biti opravdana slučajno, što često zahtijeva stručnost u području predmeta. Ograničenje isključenja ne može se opravdati slučajnošću ohrabrenja. Drugo, uobičajeni praktični izazov s instrumentalnom varijabilnom analizom dolazi kada poticanje ima malo utjecaja na primjenu liječenja (kada je mala) \(\text{ITT}_W\) ). To se naziva slabim instrumentom i dovodi do različitih problema (Imbens and Rosenbaum 2005; Murray 2006) . Jedan od načina razmišljanja o problemu slabih instrumenata je da \(\widehat{\text{CACE}}\) može biti osjetljiv na male pristranosti u \(\widehat{\text{ITT}_Y}\) potencijalno zbog kršenja ograničenja isključenja - jer se ta predrasuda povećavaju malim \(\widehat{\text{ITT}_W}\) (vidi 2.13). Ukratko, ako tretman koji priroda dodjeljuje ne utječe na liječenje koje vam je stalo, tada ćete teško saznati za liječenje koje vam je stalo.
Vidi poglavlja 23 i 24 Imbens and Rubin (2015) za više formalnu verziju ove rasprave. Tradicionalni ekonometrijski pristup instrumentalnim varijablama tipično se izražava u smislu procjene jednadžbi, a ne potencijalnih ishoda. Za uvod iz ove druge perspektive, vidi Angrist and Pischke (2009) , te za usporedbu dvaju pristupa, pogledajte odjeljak 24.6 Imbens and Rubin (2015) . Alternativno, nešto manje formalno predstavljanje pristupa instrumentalnih varijabli nalazi se u poglavlju 6 Gerber and Green (2012) . Više o ograničenju isključenja potražite u D. Jones (2015) . Aronow and Carnegie (2013) opisuju dodatni skup pretpostavki koje se mogu koristiti za procjenu ATE-a umjesto CACE-a. Više o tome kako prirodni pokusi mogu biti vrlo lukav tumačiti, pogledajte Sekhon and Titiunik (2012) . Za općenitije uvod u prirodne pokuse - onaj koji nadilazi samo pristup instrumentalnih varijabli također uključuje dizajne poput diskontinuiteta regresije - vidi Dunning (2012) .