Dina lampiran ieu, kuring baris nyimpulkeun sababaraha pamendak ngeunaan nyieun inferensi kausal tina data non-eksperimen dina formulir rada leuwih matematik. Aya dua deukeut utama: kerangka grafik kausal, paling pakait sareng Yudea Mutiara sareng kolega Anjeun, tur potensi kerangka hasil, paling pakait sareng Donald Rubin sareng kolega Anjeun. Kuring baris ngawanohkeun potensi kerangka hasil sabab geus leuwih raket disambungkeun ka pamanggih dina catetan matematika di ahir surah 3 jeung 4. Pikeun leuwih dina kerangka grafik kausal, abdi nyarankeun Pearl, Glymour, and Jewell (2016) (bubuka ) jeung Pearl (2009) (canggih). Pikeun pengobatan buku-panjang inferensi kausal nu ngagabungkeun kerangka hasil poténsi jeung kerangka grafik kausal, abdi nyarankeun Morgan and Winship (2014) .
Tujuan lampiran ieu mantuan anjeun meunang teu nyaman jeung notasi sarta gaya ti tradisi hasil poténsi ku kituna anjeun bisa transisi ka sababaraha bahan leuwih teknis ditulis dina topik ieu. Kahiji, abdi gé ngajelaskeun potensi kerangka hasil. Lajeng, abdi gé nganggo eta jang meberkeun ngabahas percobaan alam kawas hiji ku Angrist (1990) dina efek jasa militér dina earnings. Lampiran ieu draws beurat on Imbens and Rubin (2015) .
Kerangka poténsi hasil
Potensi kerangka hasil boga tilu elemen utama: unit, perlakuan, jeung hasil poténsial. Dina raraga ngagambarkeun elemen ieu, hayu urang nganggap versi stylized tina sual bisa kajawab ku Angrist (1990) : Naon pangaruh jasa militér dina earnings? Dina hal ieu, urang bisa nangtukeun unit janten jalma layak pikeun 1970 draf di Amérika Serikat, sarta kami bisa indéks jalma ieu ku \(i = 1, \ldots, N\) . The perlakuan dina hal ieu tiasa "porsi di militer" atanapi "teu porsi di militer." Kuring gé nelepon kaayaanana pengobatan sarta control ieu, sarta kuring bakal nulis \(W_i = 1\) lamun jalma \(i\) nyaeta dina kaayaan pengobatan sarta \(W_i = 0\) lamun jalma \(i\) nyaeta dina kaayaan kontrol. Tungtungna, anu hasil poténsi nu bit langkung conceptually hésé sabab ngalibetkeun "potensial" hasil; hal anu bisa geus kajadian. Pikeun unggal jalma layak pikeun 1970 draf, urang tiasa ngabayangkeun jumlah nu maranéhna bakal geus earned taun 1978 lamun aranjeunna dilayanan di militer, nu kuring bakal nelepon \(Y_i(1)\) , sarta jumlah nu maranéhna bakal geus earned di 1978 mun maranéhna henteu ngawula di militer, nu kuring bakal nelepon \(Y_i(0)\) . Dina kerangka hasil poténsi, \(Y_i(1)\) sarta \(Y_i(0)\) kuantitas dibereskeun dianggap, bari \(W_i\) ngarupakeun variabel acak.
Pilihan unit, perlakuan, jeung hasil anu kritis sabab ngahartikeun naon bisa-na teu bisa-bisa diajar ti pangajian. Pilihan unit-jalma layak pikeun 1970 draf-henteu kaasup awéwé, sarta jadi tanpa asumsi tambahan, ulikan ieu moal ngabejaan urang nanaon ngeunaan pangaruh jasa militér dina awéwé. Kaputusan ngeunaan kumaha carana nangtukeun perlakuan jeung hasil penting ogé. Contona, kedah perlakuan dipikaresep jadi fokus kana porsi di militer atawa ngalaman ngempur? Kedah hasil dipikaresep jadi earnings atanapi kapuasan pakasaban? Pamustunganana, pilihan unit, perlakuan, jeung hasil kudu disetir ku gol ilmiah jeung kawijakan pangajaran.
Dibikeun pilihan unit, perlakuan, jeung hasil poténsi, efek kausal tina perlakuan dina baé \(i\) , \(\tau_i\) , nyaeta
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Dina basa sejen, urang ngabandingkeun sabaraha baé \(i\) bakal geus earned sanggeus porsi keur sabaraha jalma \(i\) bakal geus earned tanpa porsi. Pikeun abdi, EQ. 2.1 nyaeta cara clearest keur ngartikeun éfék kausal, sarta sanajan pisan basajan, kerangka ieu tétéla mun generalizable ku sababaraha cara penting jeung metot (Imbens and Rubin 2015) .
Lamun ngagunakeun kerangka hasil poténsi, abdi sering manggihan eta mantuan nulis kaluar hiji méja némbongkeun hasil poténsi jeung épék perlakuan pikeun sakabéh unit (tabel 2.5). Mun anjeun teu bisa ngabayangkeun hiji méja kawas ieu ulikan anjeun, mangka anjeun bisa kudu jadi leuwih hade dina definisi Anjeun unit, perlakuan, jeung hasil poténsi Anjeun.
jelema | Earnings dina kaayaan perlakuan | Earnings dina kaayaan kontrol | éfék perlakuan |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
maksudna | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Lamun watesan efek kausal di jalan ieu, kumaha ogé, urang ngajalankeun kana masalah. Ampir sakabeh kasus, kami teu meunang pikeun niténan duanana calon hasil. Hartina, hiji jalma husus boh dilayanan atanapi teu ngalayanan. Kituna, urang niténan salah sahiji outcomes- poténsi \ \(Y_i(1)\) atanapi \(Y_i(0)\) -but teu duanana. The henteu mampuh pikeun niténan duanana calon hasil nyaéta sarupaning masalah utama nu Holland (1986) disebut di Masalah dasar tina kausal kaputusan.
Untungna, lamun urang keur ngalakonan panalungtikan, urang ulah ngan boga hiji jalma; rada kami kudu loba jalma, sarta ieu nawarkeun cara sabudeureun Masalah dasar tina kausal kaputusan. Gantina ngusahakeun estimasi éfék perlakuan individu-tingkat, urang tiasa estimasi éfék perlakuan rata pikeun sakabéh unit:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Persamaan ieu masih ditembongkeun dina watesan tina \(\tau_i\) , nu mangrupakeun teu ka-observasi, tapi mibanda sababaraha aljabar (EQ 2.8 tina Gerber and Green (2012) ), urang meunang
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Ieu nunjukeun yen lamun bisa nga-estimasi populasi hasilna rata dina perlakuan ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) jeung populasi rata hasilna dina kontrol ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), mangka urang bisa estimasi éfék perlakuan rata, malah tanpa estimasi éfék perlakuan kanggo naon baé tangtu.
Ayeuna mah geus tangtu urang estimand-hal kami nyoba estimasi-I'll giliran sabaraha urang sabenerna bisa estimasi eta kalawan data. Sarta di dieu urang ngajalankeun langsung kana masalah nu urang ukur niténan salah sahiji hasil potensi masing-masing jalma; urang tingali boh \(Y_i(0)\) atanapi \(Y_i(1)\) (tabel 2.6). Urang bisa estimasi éfék perlakuan rata ku ngabandingkeun earnings sahiji jalma nu dilayanan ka earnings sahiji jalma anu teu ngalayanan:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
dimana \(N_t\) sarta \(N_c\) anu nomer tina jalma dina kaayaan pengobatan sarta kontrol. Pendekatan ieu bakal dianggo ogé lamun dina ngerjakeun perlakuan anu bebas tina hasil poténsi, kaayaan hiji kadangkala disebut ignorability. Hanjakal, dina henteuna hiji percobaan, ignorability teu sering puas, anu hartina estimator di EQ. 2.4 teu dipikaresep pikeun ngahasilkeun estimasi alus. Hiji cara mikir ngeunaan éta yén dina henteuna ngerjakeun acak perlakuan, EQ. 2.4 teu ngabandingkeun kawas kalawan kawas; eta anu ngabandingkeun earnings tina rupa béda ti urang. Atawa dikedalkeun rada beda, tanpa ngerjakeun acak perlakuan, alokasi perlakuan anu meureun patali hasil poténsial.
Dina ieu bab 4, abdi gé ngajelaskeun kumaha randomized percobaan dikawasa bisa mantuan peneliti nyieun perkiraan kausal, sarta di dieu kuring gé ngajelaskeun kumaha peneliti bisa ngamangpaatkeun percobaan alam, kayaning RUU lotre.
jelema | Earnings dina kaayaan perlakuan | Earnings dina kaayaan kontrol | éfék perlakuan |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
maksudna | ? | ? | ? |
percobaan Pengetahuan alam
Hiji pendekatan nyieun perkiraan kausal tanpa ngajalankeun hiji percobaan nyaeta néangan hal lumangsung di dunya nu geus acak ditugaskeun perlakuan pikeun anjeun. Pendekatan ieu disebut percobaan alam. Dina loba kaayaan, hanjakalna, alam teu acak nganteurkeun perlakuan nu rék populasi dipikaresep. Tapi sakapeung, alam acak delivers perlakuan patali. Dina sababaraha hal, kuring gé mertimbangkeun kasus dimana aya sababaraha perlakuan sekundér anu nyorong urang pikeun nampa perlakuan primér. Contona, draf teh bisa dianggap perlakuan sekundér acak ditugaskeun yén wanti sababaraha urang nyandak perlakuan primér, nu ieu porsi di militer. Desain ieu kadangkala disebut hiji rarancang dorongan. Jeung métode analisis anu kuring gé ngajelaskeun pikeun nanganan kaayaan ieu kadangkala disebut variabel instrumental. Dina setting ieu, kalawan sababaraha asumsi, peneliti tiasa nganggo dorongan pikeun ngalenyepan efek perlakuan primér pikeun sawaréh tinangtu unit.
Dina raraga nanganan dua perlakuan-nu béda dorongan sarta primér perlakuan-urang butuh sababaraha notasi anyar. Anggap eta sababaraha urang anu acak drafted ( \(Z_i = 1\) ) atanapi henteu drafted ( \(Z_i = 0\) ); di ieu kaayaan, \(Z_i\) kadangkala disebut hiji alat ukur.
Di antara maranéhanana anu drafted, sababaraha dilayanan ( \(Z_i = 1, W_i = 1\) ) jeung sabagian teu ( \(Z_i = 1, W_i = 0\) ). Kitu ogé, di antara maranéhanana anu teu nyusun, sababaraha dilayanan ( \(Z_i = 0, W_i = 1\) ) jeung sabagian teu ( \(Z_i = 0, W_i = 0\) ). The hasil potensi masing-masing jalma bisa kiwari jadi dimekarkeun pikeun némbongkeun status maranéhanana pikeun boh dorongan sarta perlakuan. Contona, hayu \(Y(1, W_i(1))\) jadi earnings jalma \(i\) lamun anjeunna nyusun, dimana \(W_i(1)\) nyaeta status layanan na lamun drafted. Salajengna, urang tiasa dibeulah populasi jadi opat golongan: compliers, pernah-takers, defiers, sarta salawasna-takers (tabel 2.7).
ngetik | Service lamun drafted | Service lamun teu drafted |
---|---|---|
Compliers | Sumuhun, \(W_i(Z_i=1) = 1\) | Taya, \(W_i(Z_i=0) = 0\) |
Pernah-takers | Taya, \(W_i(Z_i=1) = 0\) | Taya, \(W_i(Z_i=0) = 0\) |
Defiers | Taya, \(W_i(Z_i=1) = 0\) | Sumuhun, \(W_i(Z_i=0) = 1\) |
Salawasna-takers | Sumuhun, \(W_i(Z_i=1) = 1\) | Sumuhun, \(W_i(Z_i=0) = 1\) |
Sateuacan urang bahas estimasi efek perlakuan (ie, layanan militer), urang mimiti bisa nangtukeun dua balukar dorongan ti (ie, keur nyusun). Kahiji, urang bisa nangtukeun efek dorongan dina perlakuan primér. Kadua, urang bisa nangtukeun efek tina dorongan kana hasilna. Ieu bakal ngahurungkeun kaluar nu dua épék ieu bisa digabungkeun pikeun nyadiakeun keur estimasu efek perlakuan dina grup husus urang.
Kahiji, pangaruh tina dorongan kana perlakuan bisa diartikeun pikeun jalma \(i\) salaku
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Salajengna, kuantitas ieu bisa dihartikeun leuwih sakabéh populasi salaku
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Tungtungna, urang tiasa estimasi \(\text{ITT} _{W}\) ngagunakeun data:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
dimana \(\bar{W}^{\text{obs}}_1\) anu laju dititénan pengobatan pikeun maranéhanana anu wanti sarta \(\bar{W}^{\text{obs}}_0\) nyaéta laju dititénan pengobatan pikeun maranéhanana anu teu wanti. \(\text{ITT}_W\) sok disebut ogé laju uptake.
Salajengna, pangaruh tina dorongan kana hasilna bisa diartikeun pikeun jalma \(i\) salaku:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Salajengna, kuantitas ieu bisa dihartikeun leuwih sakabéh populasi salaku
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Tungtungna, urang tiasa estimasi \(\text{ITT}_{Y}\) ngagunakeun data:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
dimana \(\bar{Y}^{\text{obs}}_1\) nyaéta hasil observasi (misalna earnings) pikeun jalma anu wanti (misalna drafted) jeung \(\bar{W}^{\text{obs}}_0\) nyaéta hasil observasi pikeun maranéhanana anu teu wanti.
Tungtungna, urang balikkeun perhatian urang kana pangaruh dipikaresep: efek perlakuan primér (misalna jasa militér) dina hasilna (misalna earnings). Hanjakal, tétéla yén hiji bisa, sacara umum, estimasi éfék ieu dina sagala unit. Sanajan kitu, kalawan sababaraha asumsi, peneliti tiasa estimasi efek perlakuan dina compliers (ie, jalma anu bakal ngawula lamun drafted jeung jalma anu moal ngawula lamun teu drafted, tabel 2.7). Kuring gé nelepon ieu estimand nu complier rata pangaruh kausal (CACE) (anu oge kadangkala disebut efek perlakuan rata lokal, telat):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
dimana \(G_i\) nyumbangkeun grup jalma \(i\) (tingali tabél 2.7) jeung \(N_{\text{co}}\) nya éta sajumlah compliers. Dina basa sejen, EQ. 2,11 compares earnings of compliers anu drafted \(Y_i(1, W_i(1))\) teu drafted \(Y_i(0, W_i(0))\) . The estimand di EQ. 2,11 sigana teuas keur estimasi tina data observasi ku sabab teu mungkin pikeun ngaidentipikasi compliers maké ukur ditempo data (uninga lamun batur téh complier bakal nu peryogi nitenan naha anjeunna dilayanan nalika nyusun jeung naha manehna dilayanan lamun teu drafted).
Tétéla-rada heran-yén lamun aya wae compliers, teras disadiakeun hiji ngajadikeun tilu asumsi tambahan, kasebut nyaéta dimungkinkeun pikeun estimasi CACE tina data observasi. Kahiji, hiji geus nganggap yen ngerjakeun kana perlakuan anu acak. Dina kasus RUU lotre ieu lumrah. Sanajan kitu, dina sababaraha setélan mana percobaan alam ulah ngandelkeun randomization fisik, asumsi ieu bisa jadi leuwih masalah. Kadua, salah geus nganggap yen disebut euweuh defiers (asumsi ieu sok disebut ogé asumsi monotonicity). Dina konteks draf teh sigana lumrah mun nganggap yen aya saeutik pisan jalma nu moal ngawula lamun drafted sarta bakal ngawula lamun teu drafted. Katilu, sarta tungtungna, asalna anggapan pangpentingna nu disebut wangenan pangaluaran. Dina wangenan pangaluaran, salah geus nganggap yen sakabéh pangaruh tina ngerjakeun perlakuan dialirkeun perlakuan sorangan. Dina basa sejen, hiji boga nganggap yén teu aya pangaruh langsung tina dorongan dina hasil. Dina kasus RUU lotre, contona, hiji perlu nganggap yén draf status boga pangaruh dina earnings lian ti ngaliwatan layanan militér (inohong 2.11). Wangenan pangaluaran bisa dilanggar lamun, contona, urang anu drafted spent langkung waktos di sakola dina urutan ulah jasa atawa lamun dunungan éta kurang kamungkinan kana nyewa jalma anu drafted.
Mun tilu kaayaan ieu (ngerjakeun acak pikeun pengobatan, teu defiers, sarta wangenan pangaluaran) nu patepung, teras
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
sangkan bisa estimasi CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Hiji cara mikir ngeunaan CACE téh nya éta anu bédana dina hasil antara jalma anu wanti sarta maranéhanana henteu wanti, inflated ku laju uptake.
Aya dua caveats penting pikeun tetep dina pikiran. Kahiji, wangenan pangaluaran téh asumsi kuat, sarta eta perlu diyakinkeun dina dasar hal-demi-hal nu remen merlukeun kaahlian poko-wewengkon. Wangenan pangaluaran teu bisa diyakinkeun kalawan randomization tina dorongan nu. Kadua, mangrupa tantangan praktis umum kalawan analisis variabel instrumental asalna nalika dorongan ngabogaan saeutik pangaruh dina uptake perlakuan (lamun \(\text{ITT}_W\) nyaéta leutik). Ieu disebut pakakas lemah, sarta eta ngabalukarkeun rupa-rupa masalah (Imbens and Rosenbaum 2005; Murray 2006) . Hiji cara mikir ngeunaan masalah kalayan instrumen lemah éta \(\widehat{\text{CACE}}\) tiasa peka biases leutik di \(\widehat{\text{ITT}_Y}\) -potentially alatan pelanggaran nu pangaluaran pangwatesan-sabab biases ieu perlu magnified ku leutik \(\widehat{\text{ITT}_W}\) (tingali EQ. 2.13). Kasarna, upami perlakuan nu nangtukeun sifat teu boga dampak badag dina perlakuan Anjeun ngeunaan miara, lajeng Anjeun bade gaduh teuas waktos diajar ngeunaan perlakuan Anjeun ngeunaan miara.
Tempo bab 23 sarta 24 of Imbens and Rubin (2015) pikeun versi leuwih formal sawala ieu. Pendekatan econometric tradisional variabel instrumental ieu ilaharna ditembongkeun dina watesan estimasi persamaan, moal hasil poténsial. Pikeun hiji bubuka tina sudut pandang sejen ieu, tingali Angrist and Pischke (2009) , sarta pikeun ngabandingkeun antara dua deukeut, tingali bagian 24,6 of Imbens and Rubin (2015) . Alternatif, rada presentasi kirang formal tina pendekatan variabel instrumental geus disadiakeun dina bab 6 of Gerber and Green (2012) . Pikeun langkung lengkep ihwal wangenan pangaluaran, tingali D. Jones (2015) . Aronow and Carnegie (2013) ngajelaskeun hiji set tambahan tina asumsi nu bisa dipaké pikeun estimasi ate tinimbang CACE. Pikeun langkung lengkep ihwal kumaha percobaan alam tiasa pisan tricky mun naksir, tingali Sekhon and Titiunik (2012) . Pikeun bubuka leuwih umum pikeun alam percobaan-hiji nu mana saluareun ngan pendekatan variabel instrumental kana ogé ngawengku desain kayaning regression discontinuity-tingali Dunning (2012) .