V tomto dodatku zhrniem niekoľko myšlienok o tom, že kauzálny záver z nepermanentných údajov v trochu viac matematickej forme. Existujú dva hlavné prístupy: kauzálny grafový rámec, najviac súvisiaci s Judoulou Pearlovou a kolegami a rámec potenciálnych výsledkov, najviac spojený s Donaldom Rubinom a kolegami. Predstavím rámec potenciálnych výsledkov, pretože je užšie prepojený s myšlienkami v matematických poznámkach na konci kapitoly 3 a 4. Viac informácií o rámcoch kauzálnych grafov odporúčam Pearl, Glymour, and Jewell (2016) (úvodná ) a Pearl (2009) (rozšírené). Pri dlhodobej liečbe kauzálnej dedukcie, ktorá kombinuje potenciálny výsledný rámec a rámec príčinných grafov, odporúčam Morgan and Winship (2014) .
Cieľom tejto prílohy je pomôcť vám získať spokojnosť s notáciou a štýlom potenciálnych výsledkov tradície, aby ste mohli prejsť na niektoré z technickejších materiálov napísaných na túto tému. Po prvé, popíšem možný výsledný rámec. Potom ju budem používať na ďalšie diskusie o prírodných experimentoch, ako je napríklad Angrist (1990) o vplyve vojenskej služby na zárobky. Táto príloha čerpá silne na Imbens and Rubin (2015) .
Potenciálny výsledný rámec
Potenciálny výstupný rámec má tri hlavné prvky: jednotky , liečby a potenciálne výsledky . Aby sme ilustrovali tieto prvky, uvažujme o štylizovanú verziu otázky, ktorá sa venuje Angrist (1990) : Aký je vplyv vojenskej služby na zárobky? V tomto prípade môžeme definovať jednotky ako osoby oprávnené na návrh z roku 1970 v Spojených štátoch a tieto osoby môžeme indexovať pomocou \(i = 1, \ldots, N\) . Liečba v tomto prípade môže byť "slúžiť v armáde" alebo "nepracovať v armáde". Vyzývam tieto liečebné a kontrolné podmienky a napíšem \(W_i = 1\) ak osoba \(i\) je v liečebnom stave a \(W_i = 0\) ak osoba \(i\) je v kontrolnom stave. Napokon, potenciálne výsledky sú trochu koncepčne ťažšie, pretože zahŕňajú "potenciálne" výsledky; čo sa mohlo stať. Pre každú osobu, ktorá má nárok na návrh z roku 1970, si dokážeme predstaviť sumu, ktorú by získali v roku 1978, ak by slúžili vo vojenskej oblasti, ktorú budem nazývať \(Y_i(1)\) a sumu, 1978, ak neslúžili v armáde, ktorú budem nazývať \(Y_i(0)\) . V potenciálnom \(Y_i(1)\) rámci sa \(Y_i(1)\) a \(Y_i(0)\) považujú za fixné množstvá, zatiaľ čo \(W_i\) je náhodná premenná.
Výber jednotiek, liečebných postupov a výsledkov je rozhodujúci, pretože definuje, čo sa od štúdia môže a nemôže stať. Voľba jednotiek - osôb oprávnených na návrh z roku 1970 - nezahŕňa ženy, a preto bez ďalších predpokladov nám táto štúdia nepovedie nič o vplyve vojenskej služby na ženy. Aj rozhodnutia o tom, ako definovať liečbu a výsledky, sú dôležité. Napríklad, ak by sa zaobchádzanie s záujmom malo sústrediť na slúženie vo vojenskej oblasti alebo v boji? Mali by byť výsledkom záujmu zárobky alebo pracovná spokojnosť? Nakoniec by výber jednotiek, liečby a výsledkov mal byť riadený vedeckými a politickými cieľmi štúdie.
Vzhľadom na výber jednotiek, liečby a potenciálnych výsledkov je príčinný účinok liečby na osobu \(i\) , \(\tau_i\) , je
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Inými slovami, porovnávame, koľko osôb \(i\) by si zarobil po tom, ako bude slúžiť na to, koľko osôb \(i\) by si zarobila bez doručenia. Pre mňa, eq. 2.1 je najjasnejší spôsob definovania kauzálneho efektu a hoci je veľmi jednoduchý, tento rámec sa (Imbens and Rubin 2015) do mnohých dôležitých a zaujímavých spôsobov (Imbens and Rubin 2015) .
Pri použití potenciálneho výstupného rámca som často považoval za užitočné napísať tabuľku s potenciálnymi výsledkami a účinkami liečby pre všetky jednotky (tabuľka 2.5). Ak si nemôžete predstaviť takú tabuľku pre vašu štúdiu, potom by ste mohli potrebovať presnejšie definície vašich jednotiek, liečby a potenciálnych výsledkov.
človek | Zisk v liečebnom stave | Zisk v riadenom stave | Liečebný účinok |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
znamenať | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Pri definovaní kauzálneho efektu týmto spôsobom narazíme na problém. Takmer vo všetkých prípadoch nedosahujeme oba možné výsledky. To znamená, že konkrétna osoba buď slúžila, alebo neslúžila. Z tohto dôvodu pozorujeme jeden z potenciálnych výsledkov - \(Y_i(1)\) alebo \(Y_i(0)\) ale nie oboje. Neschopnosť pozorovať oba možné výsledky je taký veľký problém, ktorý Holland (1986) nazval základným problémom príčinných záverov .
Našťastie, keď robíme výskum, nemáme len jednu osobu; skôr máme veľa ľudí a toto ponúka cestu okolo základného problému príčinných záverov. Namiesto toho, aby sme sa pokúsili odhadnúť individuálny účinok liečby, môžeme odhadnúť priemerný účinok liečby pre všetky jednotky:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Táto rovnica je stále vyjadrená ako \(\tau_i\) , ktoré sú nepozorovateľné, ale s určitou algebrou (eq 2.8 Gerber and Green (2012) ), dostaneme
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
To ukazuje, že pre odhad priemeru populácie výsledok, ktorý je liečený ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) a populácia priemerný výsledok pod kontrolou ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), potom môžeme odhadnúť priemerný účinok liečby aj bez odhadu účinku liečby pre ktorúkoľvek konkrétnu osobu.
Teraz, keď som definoval náš odhad - to, čo sa snažíme odhadnúť - sa obrátim k tomu, ako ho môžeme skutočne odhadnúť údajmi. A tu narazíme priamo na problém, ktorý pozorujeme len na jeden z potenciálnych výsledkov pre každého človeka. vidíme buď \(Y_i(0)\) alebo \(Y_i(1)\) (tabuľka 2.6). Mohli by sme odhadnúť priemerný účinok liečby porovnaním zárobkov ľudí, ktorí slúžili na zárobky ľudí, ktorí nepôsobili:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
kde \(N_t\) a \(N_c\) sú počty ľudí v liečebných a kontrolných podmienkach. Tento prístup bude fungovať správne, ak je priradenie liečby nezávislé na potenciálnych výsledkoch, čo je stav, ktorý sa niekedy nazýva ignorovateľnosťou . Bohužiaľ, pri absencii experimentu, ignorovanie nie je často splnené, čo znamená, že odhad v ekv. 2.4 pravdepodobne nebude mať dobrý odhad. Jeden spôsob, ako o tom myslieť, je to, že pri absencii náhodného priradenia liečby, napr. 2.4 nie je v porovnaní s podobnými; porovnáva príjmy rôznych druhov ľudí. Alebo vyjadrené mierne odlišné, bez náhodného priradenia liečby, alokácia liečby pravdepodobne súvisí s potenciálnymi výsledkami.
V kapitole 4 opíšem, ako môžu randomizované kontrolované experimenty pomôcť výskumníkom robiť kauzálne odhady a tu budem popísať, ako môžu výskumníci využiť prírodné experimenty, ako napríklad návrh lotérie.
človek | Zisk v liečebnom stave | Zisk v riadenom stave | Liečebný účinok |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
znamenať | ? | ? | ? |
Prirodzené experimenty
Jeden prístup k vytvoreniu kauzálnych odhadov bez toho, aby ste vykonali experiment, je hľadať niečo, čo sa deje vo svete, ktorý vám náhodne priradil liečbu. Tento prístup sa nazýva prirodzené experimenty . V mnohých situáciách, bohužiaľ, príroda nenápadne neposkytuje liečbu, ktorú chcete záujmovej populácii. Niekedy však príroda náhodne prináša súvisiacu liečbu. Predovšetkým budem brať do úvahy prípad, keď existuje sekundárne liečenie, ktoré povzbudzuje ľudí, aby dostávali primárnu liečbu . Napríklad návrh by sa mohol považovať za náhodne pridelené sekundárne liečenie, ktoré povzbudilo niektorých ľudí, aby prijali primárnu liečbu, ktorá slúžila v armáde. Tento dizajn sa niekedy nazýva návrhom povzbudenia . A metóda analýzy, ktorú opísám, aby som zvládla túto situáciu, sa niekedy nazýva inštrumentálne premenné . V tomto nastavení, s niektorými predpokladmi, vedci môžu využiť povzbudenie, aby sa dozvedeli o účinku primárnej liečby pre určitú podmnožinu jednotiek.
Aby sme zvládli dve rôzne liečby - povzbudenie a primárnu liečbu - potrebujeme nejaký nový záznam. Predpokladajme, že niektorí ľudia sú náhodne navrhnutý ( \(Z_i = 1\) ) alebo nie je navrhnutý ( \(Z_i = 0\) ); v tejto situácii sa \(Z_i\) niekedy nazýva nástrojom .
Medzi navrhovateľmi boli niektoré ( \(Z_i = 1, W_i = 1\) ) a niektoré neboli ( \(Z_i = 1, W_i = 0\) ). Podobne, medzi tými, ktorí neboli prepracovaní, niektorí slúžili ( \(Z_i = 0, W_i = 1\) ) a niektorí nemali ( \(Z_i = 0, W_i = 0\) ). Potenciálne výsledky pre každú osobu môžu byť teraz rozšírené, aby ukázali svoj status pre povzbudenie aj liečbu. Napríklad nechajte \(Y(1, W_i(1))\) príjmom osoby \(i\) ak bol navrhnutý, kde \(W_i(1)\) je jeho stav služby, ak je navrhnutý. Ďalej môžeme rozdeliť obyvateľstvo do štyroch skupín: komplienti, neveriaci, odmietajúci a neustále sa ujímajúci (tabuľka 2.7).
typ | Služba, ak je vypracovaná | Služba, ak nie je vypracovaná |
---|---|---|
Compliers | Áno, \(W_i(Z_i=1) = 1\) | Nie, \(W_i(Z_i=0) = 0\) |
nikdy odberateľovi | Nie, \(W_i(Z_i=1) = 0\) | Nie, \(W_i(Z_i=0) = 0\) |
Defiers | Nie, \(W_i(Z_i=1) = 0\) | Áno, \(W_i(Z_i=0) = 1\) |
vždy odberateľovi | Áno, \(W_i(Z_i=1) = 1\) | Áno, \(W_i(Z_i=0) = 1\) |
Predtým, ako budeme diskutovať o odhadovaní účinku liečby (tj vojenskej služby), môžeme najskôr definovať dva dôsledky povzbudenia (tj pripravované). Po prvé, môžeme definovať vplyv podpory na primárnu liečbu. Po druhé, môžeme definovať vplyv povzbudenia na výsledok. Ukáže sa, že tieto dva účinky môžu byť kombinované, aby poskytli odhad účinku liečby na konkrétnu skupinu ľudí.
Po prvé, vplyv povzbudenia na liečbu možno definovať pre osobu \(i\) ako
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Toto množstvo sa môže definovať aj na celú populáciu ako
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Nakoniec môžeme odhadovať \(\text{ITT} _{W}\) pomocou údajov:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
kde \(\bar{W}^{\text{obs}}_1\) je pozorovaná miera liečby pre tých, ktorí boli povzbudení a \(\bar{W}^{\text{obs}}_0\) pozorovaná miera liečby pre tých, ktorí neboli povzbudení. \(\text{ITT}_W\) sa niekedy nazýva aj rýchlosť prijímania .
Následne môže byť povzbudenie na výsledok definované pre osobu \(i\) ako:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Toto množstvo sa môže definovať aj na celú populáciu ako
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Nakoniec môžeme odhadovať \(\text{ITT}_{Y}\) pomocou údajov:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
kde \(\bar{Y}^{\text{obs}}_1\) je pozorovaný výsledok (napr zisk) pre tých, ktorí boli vyzvaní (napr odvedený) a \(\bar{W}^{\text{obs}}_0\) je pozorovaný výsledok pre tých, ktorí neboli povzbudení.
Nakoniec venujeme pozornosť účinku záujmu: účinok primárnej liečby (napr. Vojenskej služby) na výsledok (napr. Zárobok). Bohužiaľ sa ukazuje, že všeobecne nemožno tento vplyv odhadnúť na všetky jednotky. Podľa niektorých predpokladov však vedci dokážu odhadnúť účinok liečby na osoby zodpovedné za podozrenie (tj osoby, ktoré budú slúžiť, ak budú navrhnuté, a ľudia, ktorí nebudú slúžiť, ak nie sú vypracovaní, tabuľka 2.7). Ozývam to odhadom priemerného kauzálneho efektu kompenzátora (CACE) (ktorý sa niekedy nazýva aj lokálny priemerný účinok liečby , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
kde \(G_i\) daruje skupinu osoby \(i\) (pozri tabuľku 2.7) a \(N_{\text{co}}\) je počet kompilátorov. Inými slovami, eq. 2.11 porovnáva zárobky kompilátorov, ktorí sú navrhovaní \(Y_i(1, W_i(1))\) a nie sú navrhnuté \(Y_i(0, W_i(0))\) . Odhad v ekv. 2.11 je ťažké odhadnúť z pozorovaných údajov, pretože nie je možné identifikovať kompilátorov, ktorí používajú len pozorované údaje (vedieť, či je niekto kompilátorom, budete musieť pozorovať, či slúžil pri zostavovaní a či slúžil, keď nebol navrhnutý).
Ukazuje sa - trochu prekvapujúco - že ak existujú nejaké kompilátory, potom za predpokladu, že sa urobia ďalšie tri predpoklady, je možné odhadnúť CACE z pozorovaných údajov. Po prvé, treba predpokladať, že priradenie k liečbe je náhodné. V prípade návrhu lotérie to je rozumné. Avšak v niektorých situáciách, keď sa prírodné experimenty nespoliehajú na fyzickú randomizáciu, tento predpoklad môže byť problematickejší. Po druhé, človek musí predpokladať, že ich nie sú ničiaci (tento predpoklad je tiež niekedy nazývaný predpoklad monotónnosti). V kontexte návrhu sa zdá byť rozumné predpokladať, že je veľmi málo ľudí, ktorí nebudú slúžiť, ak budú navrhnuté a budú slúžiť, ak nebudú vypracované. Po tretie a nakoniec prichádza najdôležitejší predpoklad, ktorý sa nazýva obmedzenie vylúčenia . Podľa obmedzenia vylúčenia je potrebné predpokladať, že celý účinok priradenia liečby prechádza cez samotné liečenie. Inými slovami, človek musí predpokladať, že neexistuje žiadny priamy účinok povzbudenia na výsledky. Napríklad v prípade návrhu lotérie je potrebné predpokladať, že návrh štatútu nemá žiadny vplyv na iné príjmy než na vojenskú službu (obrázok 2.11). Obmedzenie vylúčenia by mohlo byť porušené, ak napríklad navrhnuté osoby strávili viac času v škole, aby sa vyhli službe, alebo ak by zamestnávatelia mali menšiu pravdepodobnosť, že budú zamestnávať navrhnutých ľudí.
Ak sú splnené tieto tri podmienky (náhodné priradenie k liečbe, žiadne odbúranie a obmedzenie vylúčenia), potom
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
takže môžeme odhadnúť CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Jedným zo spôsobov, ako premýšľať o CACE, je to, že je to rozdiel vo výsledkoch medzi tými, ktorí boli povzbudení, a tými, ktorí neboli povzbudení, naplnený mierou vychytávania.
Existujú dve dôležité upozornenia, ktoré treba mať na pamäti. Po prvé, obmedzenie vylúčenia je silným predpokladom a musí byť odôvodnené prípad od prípadu, čo často vyžaduje odborné znalosti. Obmedzenie vylúčenia nemožno odôvodniť náhodným výberom povzbudenia. Po druhé, spoločná praktická výzva s analýzou inštrumentálnych premenných prichádza, keď povzbudenie má malý vplyv na zavedenie liečby (keď \(\text{ITT}_W\) je malá). Toto sa nazýva slabý nástroj a vedie k rôznym problémom (Imbens and Rosenbaum 2005; Murray 2006) . Jedným zo spôsobov, ako premýšľať o probléme so slabými nástrojmi, je, že \(\widehat{\text{CACE}}\) môže byť citlivý na malé predpoveď v \(\widehat{\text{ITT}_Y}\) porušenie obmedzenia vylúčenia - pretože tieto predsudky sú zväčšené malým \(\widehat{\text{ITT}_W}\) (pozri \(\widehat{\text{ITT}_W}\) 2.13). Približne, ak liečba, ktorú príroda priraďuje, nemá veľký vplyv na liečbu, na ktorej vám záleží, potom budete mať ťažké sa dozvedieť o liečbe, na ktorej vám záleží.
Pozri kapitoly 23 a 24 Imbens and Rubin (2015) o formálnejšej verzii tejto diskusie. Tradičný ekonometrický prístup k inštrumentálnym premenným je zvyčajne vyjadrený z hľadiska odhadu rovníc, nie potenciálnych výsledkov. Na úvod z tejto inej perspektívy pozri Angrist and Pischke (2009) a na porovnanie medzi týmito dvoma prístupmi pozri časť 24.6 Imbens and Rubin (2015) . Alternatívna, trochu menej formálna prezentácia prístupu s inštrumentálnymi premennými je uvedená v kapitole 6 Gerber and Green (2012) . Viac informácií o obmedzení vylúčenia nájdete v článku D. Jones (2015) . Aronow and Carnegie (2013) opisujú dodatočný súbor predpokladov, ktoré možno použiť na odhadovanie ATE namiesto CACE. Viac informácií o tom, ako môžu byť prírodné experimenty veľmi náročné interpretovať, pozri Sekhon and Titiunik (2012) . Pre všeobecnejší úvod do prirodzených experimentov - jeden, ktorý presahuje iba prístup inštrumentálnych premenných, takisto zahŕňa návrhy ako regresná diskontinuita - pozri Dunning (2012) .