Katika kiambatisho hiki, nitaweka muhtasari mawazo fulani juu ya kutengeneza maelezo kutoka kwenye data isiyo ya majaribio katika fomu kidogo ya hisabati. Kuna mbinu mbili kuu: mfumo wa grafu wa causal, unaohusishwa na Pearl ya Wayahudi na wenzake, na mfumo wa matokeo ya uwezo, ambao unahusishwa na Donald Rubin na wenzake. Nitaanzisha utaratibu wa matokeo ya uwezo kwa sababu unaunganishwa kwa karibu na mawazo katika maelezo ya hisabati mwishoni mwa sura ya 3 na 4. Kwa zaidi juu ya mfumo wa grafu ya causal, ninapendekeza Pearl, Glymour, and Jewell (2016) (utangulizi ) na Pearl (2009) (ya juu). Kwa matibabu ya urefu wa kitabu cha inference causal ambayo inachanganya mfumo wa matokeo ya matokeo na mfumo wa grafu ya causal, ninapendekeza Morgan and Winship (2014) .
Lengo la kiambatisho hiki ni kukusaidia kupata starehe na uhalali na mtindo wa mila ya matokeo ya uwezekano ili uweze kubadilisha mpito kwenye vifaa vingine vya kiufundi vilivyoandikwa juu ya mada hii. Kwanza, nitaelezea mfumo wa matokeo ya matokeo. Kisha, Angrist (1990) ili kujadili tena majaribio ya asili kama yale ya Angrist (1990) juu ya athari ya huduma ya kijeshi kwenye mapato. Kiambatisho hiki kinajumuisha sana Imbens and Rubin (2015) .
Mfumo wa matokeo ya uwezekano
Mpango wa matokeo ya matokeo una vipengele vitatu kuu: vitengo , tiba , na matokeo mazuri . Ili kuonyesha mambo haya, hebu tuchunguze toleo la stylized la swali lililoongozwa katika Angrist (1990) : Je! Matokeo ya huduma ya kijeshi kwenye mapato ni nini? Katika kesi hii, tunaweza kufafanua vitengo vya kuwa watu wanaostahiki rasimu ya 1970 huko Marekani, na tunaweza kuwasilisha watu hawa kwa \(i = 1, \ldots, N\) . Matibabu katika kesi hii inaweza kuwa "kutumikia katika jeshi" au "kutumikia jeshi." Nitawaita haya hali ya matibabu na udhibiti, nami nitaandika \(W_i = 1\) ikiwa mtu \(i\) katika hali ya matibabu na \(W_i = 0\) ikiwa mtu \(i\) ana hali ya udhibiti. Hatimaye, matokeo yanayotokana ni vigumu zaidi kwa sababu yanahusika na "matokeo"; mambo ambayo yangeweza kutokea. Kwa kila mtu anayestahiki rasimu ya 1970, tunaweza kufikiria kiasi ambacho wangeweza kupata mwaka wa 1978 ikiwa wangefanya kazi katika jeshi, ambalo \(Y_i(1)\) , na kiasi ambacho watapata 1978 kama hawakuhudumia jeshi, ambalo nitaliita \(Y_i(0)\) . Katika mfumo wa matokeo ya uwezekano, \(Y_i(1)\) na \(Y_i(0)\) huhesabiwa kuwa kiasi kikubwa, wakati \(W_i\) ni mabadiliko ya random.
Uchaguzi wa vitengo, matibabu, na matokeo ni muhimu kwa sababu inafafanua nini inaweza-na haiwezi kujifunza kutoka kwenye utafiti. Uchaguzi wa vitengo-watu wanaostahiki rasimu ya 1970-haunajumuisha wanawake, na hivyo bila mawazo ya ziada, utafiti huu hautatuambia chochote kuhusu matokeo ya huduma ya kijeshi kwa wanawake. Maamuzi kuhusu jinsi ya kufafanua matibabu na matokeo ni muhimu pia. Kwa mfano, lazima matibabu ya maslahi yatazingatia kutumikia jeshi au kupambana na kupambana? Je, matokeo ya riba ni mapato au kuridhika kazi? Hatimaye, uchaguzi wa vitengo, matibabu, na matokeo inapaswa kuendeshwa na malengo ya sayansi na sera ya utafiti.
Kutokana na uchaguzi wa vitengo, tiba, na matokeo ya matokeo, athari ya causal ya matibabu kwa mtu \(i\) , \(\tau_i\) , ni
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Kwa maneno mengine, tunalinganisha ni kiasi gani mtu \(i\) angeweza kupata baada ya kutumikia kwa kiasi gani mtu \(i\) angeweza kupata bila kuhudumia. Kwa mimi, eq. 2.1 ni njia ya wazi ya kufafanua athari za causal, na ingawa ni rahisi sana, mfumo huu (Imbens and Rubin 2015) njia nyingi muhimu na za kuvutia (Imbens and Rubin 2015) .
Wakati wa kutumia mfumo wa matokeo ya matokeo, mara nyingi niona ni manufaa kuandika meza inayoonyesha matokeo na matokeo ya matibabu kwa vitengo vyote (meza ya 2.5). Ikiwa huwezi kufikiri meza kama hii kwa ajili ya utafiti wako, basi huenda unahitaji kuwa sahihi zaidi katika ufafanuzi wako wa vitengo chako, tiba, na matokeo mazuri.
Mtu | Mapato katika hali ya matibabu | Mapato katika hali ya udhibiti | Matibabu ya athari |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Maana | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Wakati wa kufafanua athari ya causal kwa njia hii, hata hivyo, tunaendesha tatizo. Katika karibu kila kesi, hatuwezi kuchunguza matokeo mawili. Hiyo ni, mtu maalum aliwahi au hakutumikia. Kwa hiyo, tunaona mojawapo ya matokeo ya matokeo- \(Y_i(1)\) au \(Y_i(0)\) - lakini si wawili. Kutokuwa na uwezo wa kuchunguza matokeo mawili ni tatizo kubwa sana kwamba Holland (1986) uliiita Tatizo la Msingi la Ufafanuzi wa Causal .
Kwa bahati nzuri, tunapofanya utafiti, hatuna mtu mmoja tu; Badala yake, tuna watu wengi, na hii inatoa njia ya kuzunguka Tatizo la Msingi la Ufafanuzi wa Causal. Badala ya kujaribu kukadiria athari ya matibabu ya kiwango cha mtu binafsi, tunaweza kukadiria athari ya wastani ya matibabu kwa vitengo vyote:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Upimaji huu bado umeelezwa kwa \(\tau_i\) , ambazo haziwezekani, lakini kwa baadhi ya algebra (eq 2.8 ya Gerber and Green (2012) ), tunapata
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Hii inaonyesha kwamba kama tunaweza kukadiria matokeo ya wastani ya idadi ya watu chini ya matibabu ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) na matokeo ya wastani ya idadi ya watu chini ya udhibiti ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), basi tunaweza kukadiria athari ya wastani ya tiba, hata bila kuzingatia athari ya matibabu kwa mtu fulani.
Sasa kwa kuwa nimeelezea makadirio yetu-kitu tunachojaribu kulinganisha-nitageuza jinsi tunavyoweza kuihesabu kwa data. Na hapa tunaendesha moja kwa moja kwenye tatizo ambalo tunaona tu matokeo ya uwezo kwa kila mtu; tunaona ama \(Y_i(0)\) au \(Y_i(1)\) (meza 2.6). Tunaweza kukadiria athari ya wastani ya matibabu kwa kulinganisha mapato ya watu waliyotumika kwa mapato ya watu ambao hawakuhudumia:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
ambapo \(N_t\) na \(N_c\) ni idadi ya watu katika hali ya matibabu na udhibiti. Njia hii itafanya kazi vizuri ikiwa mgawo wa matibabu ni huru kutokana na matokeo ya matokeo, hali wakati mwingine huitwa ignorability . Kwa bahati mbaya, kwa kutokuwepo kwa jaribio, ujuzi hauingiliwi mara nyingi, ambayo inamaanisha kwamba mchezaji wa hesabu katika q. 2.4 haiwezekani kuzalisha makadirio mema. Njia moja ya kufikiri ni kwamba kwa kutokuwepo kwa kazi ya random ya matibabu, eq. 2.4 haina kulinganisha kama na kama; ni kulinganisha mapato ya aina mbalimbali za watu. Au alionyesha tofauti kidogo, bila ya kazi ya random ya matibabu, ugawaji wa matibabu huenda unahusishwa na matokeo mazuri.
Katika sura ya 4, nitaelezea jinsi majaribio yaliyothibitiwa ya randomized yanaweza kusaidia watafiti kufanya makadirio ya causal, na hapa nitaelezea jinsi watafiti wanaweza kutumia faida ya majaribio ya asili, kama vile bahati nasibu ya rasimu.
Mtu | Mapato katika hali ya matibabu | Mapato katika hali ya udhibiti | Matibabu ya athari |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Maana | ? | ? | ? |
Majaribio ya asili
Njia moja ya kufanya makadirio ya causal bila kukimbia jaribio ni kuangalia kitu kinachotokea ulimwenguni ambacho kwa nasibu kimetoa matibabu kwako. Njia hii inaitwa majaribio ya asili . Katika hali nyingi, kwa bahati mbaya, asili haina kutoa nasibu matibabu ambayo unataka idadi ya watu wenye riba. Lakini wakati mwingine, asili nasibu hutoa matibabu yanayohusiana. Hasa, nitazingatia kesi ambapo kuna baadhi ya matibabu ya sekondari ambayo inahimiza watu kupata matibabu ya msingi . Kwa mfano, rasimu inaweza kuchukuliwa kuwa tiba ya suluhisho iliyotolewa kwa nasibu ambayo iliwahimiza baadhi ya watu kuchukua matibabu ya msingi, ambayo yalitumika katika jeshi. Wakati mwingine kubuni hii inaitwa kubuni ya faraja . Na njia ya uchambuzi ambayo nitakuelezea kushughulikia hali hii wakati mwingine huitwa vigezo vya vyombo . Katika mazingira haya, na mawazo mengine, watafiti wanaweza kutumia faraja ya kujifunza kuhusu athari za matibabu ya msingi kwa sehemu ndogo ya vitengo.
Ili kushughulikia matibabu mawili tofauti-kuhimiza na matibabu ya msingi-tunahitaji maelezo machapisho mapya. Tuseme kuwa watu wengine wameandaliwa kwa nasibu ( \(Z_i = 1\) ) au \(Z_i = 0\) ); katika hali hii, \(Z_i\) wakati mwingine huitwa chombo .
Miongoni mwa wale waliotayarishwa, baadhi walitumikia ( \(Z_i = 1, W_i = 1\) ) na wengine hawakuwa ( \(Z_i = 1, W_i = 0\) ). Vilevile, kati ya wale ambao \(Z_i = 0, W_i = 1\) , baadhi walitumikia ( \(Z_i = 0, W_i = 1\) ) na wengine \(Z_i = 0, W_i = 0\) ). Matokeo ya uwezo kwa kila mtu sasa yanaweza kupanuliwa ili kuonyesha hali yao kwa ajili ya faraja na matibabu. Kwa mfano, hebu \(Y(1, W_i(1))\) kuwa mapato ya mtu \(i\) ikiwa aliandikwa, ambapo \(W_i(1)\) hali yake ya huduma ikiwa imeandikwa. Zaidi ya hayo, tunaweza kugawanisha idadi ya watu katika makundi manne: washirika, wasio na takriban, wasiwasi, na mara kwa mara-meza (meza 2.7).
Weka | Huduma ikiwa imeandaliwa | Huduma ikiwa haijaandikwa |
---|---|---|
Wafanyabiashara | Ndiyo, \(W_i(Z_i=1) = 1\) | Hapana, \(W_i(Z_i=0) = 0\) |
Kamwe-watoaji | Hapana, \(W_i(Z_i=1) = 0\) | Hapana, \(W_i(Z_i=0) = 0\) |
Wanajivunja | Hapana, \(W_i(Z_i=1) = 0\) | Ndiyo, \(W_i(Z_i=0) = 1\) |
Wachukuaji wa daima | Ndiyo, \(W_i(Z_i=1) = 1\) | Ndiyo, \(W_i(Z_i=0) = 1\) |
Kabla ya kujadili kulinganisha athari za matibabu (yaani, huduma ya kijeshi), tunaweza kwanza kufafanua madhara mawili ya faraja (yaani, kuandikwa). Kwanza, tunaweza kufafanua athari za faraja juu ya matibabu ya msingi. Pili, tunaweza kufafanua athari za faraja juu ya matokeo. Itabadilika kuwa madhara haya mawili yanaweza kuunganishwa kutoa hesabu ya athari za matibabu kwenye kundi fulani la watu.
Kwanza, matokeo ya faraja ya matibabu inaweza kuelezwa kwa mtu \(i\) kama
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Zaidi ya hayo, wingi huu unaweza kuelezwa juu ya idadi nzima ya watu kama
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Hatimaye, tunaweza kukadiria \(\text{ITT} _{W}\) kutumia data:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
ambapo \(\bar{W}^{\text{obs}}_1\) ni kiwango cha matibabu cha wale waliohamasishwa na \(\bar{W}^{\text{obs}}_0\) ni kiwango cha matibabu cha wale ambao hawakuhimizwa. \(\text{ITT}_W\) pia wakati mwingine huitwa kiwango cha upasuaji .
Kisha, matokeo ya faraja juu ya matokeo yanaweza kuelezwa kwa mtu \(i\) kama:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Zaidi ya hayo, wingi huu unaweza kuelezwa juu ya idadi nzima ya watu kama
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Hatimaye, tunaweza kukadiria \(\text{ITT}_{Y}\) kutumia data:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
ambapo \(\bar{Y}^{\text{obs}}_1\) ni matokeo yaliyotajwa (kwa mfano, mapato) kwa wale waliohimizwa (kwa mfano, iliyoandaliwa) na \(\bar{W}^{\text{obs}}_0\) ni matokeo yaliyotajwa kwa wale ambao hawakuhimizwa.
Hatimaye, tunachukua mawazo yetu juu ya athari ya maslahi: athari za matibabu ya msingi (kwa mfano, huduma ya kijeshi) juu ya matokeo (kwa mfano, mapato). Kwa bahati mbaya, inaonyesha kwamba mtu hawezi, kwa ujumla, kukadiria athari hii kwenye vitengo vyote. Hata hivyo, kwa mawazo mengine, watafiti wanaweza kukadiria athari za matibabu kwa wauzaji (kwa mfano, watu ambao watatumikia ikiwa wameandaliwa na watu ambao hawatumiki ikiwa hawajaandikwa, meza 2.7). Nitawaita hii kuwa wastani wa athari ya causal (CACE) ambayo pia huitwa athari ya wastani ya tiba ya ndani , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
ambapo \(G_i\) hutoa kikundi cha mtu \(i\) (tazama meza 2.7) na \(N_{\text{co}}\) ni idadi ya wauzaji. Kwa maneno mengine, eq. 2.11 kulinganisha mapato ya waandishi ambao wameandikwa \(Y_i(1, W_i(1))\) na sio iliyoandikwa \(Y_i(0, W_i(0))\) . Inakadiriwa kwa eq. 2.11 inaonekana kuwa vigumu kulinganisha kutoka kwa data iliyogunduliwa kwa sababu haiwezekani kutambua wauzaji wanaotumia data tu iliyozingatiwa (kujua kama mtu anajumuisha utahitaji kuchunguza kama aliwahi wakati aliandika na kama aliwahi wakati haukuandikwa).
Inageuka-kwa kiasi fulani kushangaza-kwamba kama kuna wauzaji wowote, kisha hutoa moja hufanya mawazo mengine ya ziada, inawezekana kukadiria CACE kutoka data zilizoona. Kwanza, mtu anadhani kwamba kazi ya matibabu ni random. Katika kesi ya bahati nasibu hii ni busara. Hata hivyo, katika mipangilio fulani ambapo majaribio ya asili hayategemea randomization ya kimwili, dhana hii inaweza kuwa tatizo zaidi. Pili, mtu anadhani kuwa wao sio unajisi (dhana hii pia huitwa wakati wa dhana ya monotonicity). Katika muktadha wa rasimu inaonekana kuwa na busara kudhani kuwa kuna watu wachache ambao hawawezi kutumikia ikiwa wameandaliwa na watatumikia ikiwa haijatayarishwa. Tatu, na hatimaye, inakuja dhana muhimu zaidi inayoitwa kizuizi cha kutengwa . Chini ya kizuizi cha kutengwa, mtu anadhani kwamba matokeo yote ya misaada ya matibabu hupitishwa kupitia matibabu yenyewe. Kwa maneno mengine, mtu anadhani kuwa hakuna athari moja kwa moja ya kuhimiza matokeo. Katika kesi ya bahati nasibu ya rasimu, kwa mfano, mtu anahitaji kudhani kuwa hali ya rasimu haiathiri mapato isipokuwa kupitia huduma ya kijeshi (takwimu 2.11). Kikwazo cha kutengwa kinaweza kukiuka ikiwa, kwa mfano, watu walioandikwa walitumia muda zaidi shuleni ili kuepuka huduma au kama waajiri hawakuwa na uwezekano mdogo wa kuajiri watu walioandikwa.
Ikiwa hali hizi tatu (kazi ya random ya matibabu, hakuna uchafu, na kizuizi cha kutengwa) hukutana, basi
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
hivyo tunaweza kukadiria CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Njia moja ya kufikiri juu ya CACE ni kwamba ni tofauti kati ya matokeo ya wale waliohamasishwa na wale ambao hawakuhimizwa, wamepuuzwa na kiwango cha upasuaji.
Kuna makaburi mawili muhimu ya kukumbuka. Kwanza, kizuizi cha kutengwa ni dhana kali, na inahitaji kuwa na haki kwa msingi wa kesi-na-kesi, ambayo mara nyingi inahitaji utaalamu wa eneo. Kikwazo cha kutengwa hawezi kuhesabiwa haki na randomization ya faraja. Pili, changamoto ya kawaida ya vitendo na uchambuzi wa kutofautiana wa vyombo huja wakati faraja ina athari kidogo juu ya upatikanaji wa matibabu (wakati \(\text{ITT}_W\) ni ndogo). Hii inaitwa chombo dhaifu , na inaongoza kwa matatizo mbalimbali (Imbens and Rosenbaum 2005; Murray 2006) . Njia moja ya kufikiri juu ya tatizo na vyombo vyenye nguvu ni kwamba \(\widehat{\text{CACE}}\) inaweza kuwa na hisia kwa vikwazo vidogo katika \(\widehat{\text{ITT}_Y}\) sababu ya ukiukwaji wa kizuizi cha kutengwa-kwa sababu hizi \(\widehat{\text{ITT}_W}\) kukuzwa kwa ndogo \(\widehat{\text{ITT}_W}\) (tazama aya 2.13). Kwa kiasi kikubwa, ikiwa matibabu ambayo asili huwapa haina athari kubwa juu ya matibabu unayojali, basi utakuwa na wakati mgumu kujifunza kuhusu matibabu unayojali.
Angalia sura ya 23 na 24 ya Imbens and Rubin (2015) kwa toleo la kawaida zaidi la mjadala huu. Njia ya kiuchumi ya kiuchumi ya vigezo vya vyombo ni kawaida iliyoelezwa kwa kuzingatia usawa, sio matokeo mazuri. Kwa utangulizi kutoka kwa mtazamo mwingine, angalia Angrist and Pischke (2009) , na kwa kulinganisha kati ya mbinu mbili, ona sehemu ya 24.6 ya Imbens and Rubin (2015) . Njia mbadala, ndogo isiyo rasmi ya mbinu za vigezo vya vyombo hutolewa katika sura ya 6 ya Gerber and Green (2012) . Kwa zaidi juu ya kizuizi cha kutengwa, angalia D. Jones (2015) . Aronow and Carnegie (2013) huelezea seti ya ziada ya mawazo ambayo inaweza kutumika kukadiria ATE badala ya CACE. Kwa maelezo zaidi juu ya jinsi majaribio ya asili yanaweza kuwa ya Sekhon and Titiunik (2012) sana kutafsiri, ona Sekhon and Titiunik (2012) . Kwa utangulizi wa jumla wa majaribio ya asili-moja ambayo inakwenda zaidi ya mbinu za vigezo vya vyombo pia ni pamoja na miundo kama vile kushuka kwa regression-ona Dunning (2012) .