Dalam lampiran ini, saya akan merumuskan beberapa idea tentang membuat kesimpulan kausal daripada data bukan eksperimen dalam bentuk sedikit lebih matematik. Terdapat dua pendekatan utama: kerangka grafik kausal, yang paling berkaitan dengan Judea Pearl dan rakan sekerja, dan kerangka hasil berpotensi, yang paling berkaitan dengan Donald Rubin dan rakan sekerja. Saya akan memperkenalkan rangka kerja hasil yang berpotensi kerana ia lebih rapat berkaitan dengan idea-idea dalam nota matematik pada akhir bab 3 dan 4. Untuk lebih lanjut mengenai rangka kerja graf kausal, saya cadangkan Pearl, Glymour, and Jewell (2016) (pengenalan ) dan Pearl (2009) (maju). Untuk rawatan jangka panjang buku kesimpulan kausal yang menggabungkan rangka kerja hasil berpotensi dan kerangka grafik kausal, saya cadangkan Morgan and Winship (2014) .
Matlamat lampiran ini adalah untuk membantu anda berasa selesa dengan notasi dan gaya tradisi hasil berpotensi supaya anda boleh beralih kepada beberapa bahan yang lebih teknikal yang ditulis mengenai topik ini. Pertama, saya akan menerangkan rangka kerja hasil yang berpotensi. Kemudian, saya akan menggunakannya untuk membincangkan lagi eksperimen semula jadi seperti Angrist (1990) mengenai kesan perkhidmatan ketenteraan ke atas pendapatan. Lampiran ini amat menarik pada Imbens and Rubin (2015) .
Kerangka hasil berpotensi
Kerangka hasil berpotensi mempunyai tiga elemen utama: unit , rawatan , dan hasil yang berpotensi . Untuk menggambarkan unsur-unsur ini, mari kita pertimbangkan satu versi soalan yang diajukan dalam Angrist (1990) : Apakah kesan perkhidmatan ketenteraan ke atas pendapatan? Dalam kes ini, kita boleh menentukan unit untuk menjadi orang yang layak untuk draf 1970 di Amerika Syarikat, dan kita boleh mengindeks orang ini dengan \(i = 1, \ldots, N\) . Rawatan dalam kes ini boleh "berkhidmat dalam tentera" atau "tidak berkhidmat dalam tentera." Saya akan memanggil syarat-syarat rawatan dan kawalan ini, dan saya akan menulis \(W_i = 1\) jika orang \(i\) berada dalam keadaan rawatan dan \(W_i = 0\) jika orang \(i\) berada dalam keadaan kawalan. Akhir sekali, hasil yang berpotensi adalah sedikit lebih konseptual kerana mereka melibatkan "potensi" hasil; perkara yang boleh berlaku. Bagi setiap orang yang layak untuk draf tahun 1970, kita boleh membayangkan jumlah yang mereka akan diperolehi pada tahun 1978 jika mereka berkhidmat dalam tentera, yang saya akan panggil \(Y_i(1)\) , dan jumlah yang mereka akan memperolehi 1978 jika mereka tidak berkhidmat dalam tentera, yang saya akan panggil \(Y_i(0)\) . Dalam kerangka hasil berpotensi, \(Y_i(1)\) dan \(Y_i(0)\) dianggap kuantiti tetap, manakala \(W_i\) adalah pemboleh ubah rawak.
Pilihan unit, rawatan, dan hasil adalah kritikal kerana ia mentakrifkan apa yang boleh dan tidak dapat dipelajari dari kajian. Pilihan unit-orang yang layak untuk draf tahun 1970-tidak termasuk wanita, dan tanpa andaian tambahan, kajian ini tidak akan memberitahu kita apa-apa mengenai kesan perkhidmatan ketenteraan ke atas wanita. Keputusan mengenai cara menentukan rawatan dan hasil adalah penting juga. Contohnya, patutkah rawatan kepentingan tertumpu kepada berkhidmat dalam tentera atau mengalami pertempuran? Sekiranya hasil daripada minat menjadi pendapatan atau kepuasan kerja? Pada akhirnya, pilihan unit, rawatan, dan hasil harus dipandu oleh matlamat saintifik dan dasar kajian.
Memandangkan pilihan unit, rawatan, dan hasil berpotensi, kesan kausal rawatan pada orang \(i\) , \(\tau_i\) , adalah
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Dalam erti kata lain, kita membandingkan berapa banyak orang \(i\) akan diperolehi selepas berkhidmat untuk bagaimana orang banyak \(i\) akan usahakan tanpa hidangan. Kepada saya, persamaan 2.1 adalah cara yang paling jelas untuk menentukan kesan kausal, dan walaupun sangat mudah, rangka kerja ini ternyata umum dalam banyak cara yang penting dan menarik (Imbens and Rubin 2015) .
Apabila menggunakan kerangka hasil berpotensi, saya sering mendapati ia berguna untuk menulis jadual yang menunjukkan hasil yang berpotensi dan kesan rawatan untuk semua unit (jadual 2.5). Jika anda tidak dapat membayangkan jadual seperti ini untuk kajian anda, maka anda mungkin perlu lebih tepat dalam definisi unit, rawatan, dan hasil berpotensi anda.
Orang | Pendapatan dalam keadaan rawatan | Pendapatan dalam keadaan kawalan | Kesan rawatan |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Maksudnya | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Walau bagaimanapun, apabila menentukan kesan kausal dengan cara ini, kita menghadapi masalah. Dalam hampir semua kes, kita tidak dapat melihat kedua-dua hasil yang berpotensi. Iaitu, orang tertentu sama ada berkhidmat atau tidak berkhidmat. Oleh itu, kita melihat satu daripada hasil yang berpotensi - \(Y_i(1)\) atau \(Y_i(0)\) -but tidak keduanya. Ketidakupayaan untuk melihat kedua-dua hasil yang berpotensi merupakan masalah utama yang Holland (1986) oleh Holland (1986) sebagai Masalah Asas Kesilapan Sebab .
Nasib baik, apabila kita melakukan penyelidikan, kita tidak hanya mempunyai satu orang; Sebaliknya, kita mempunyai ramai orang, dan ini menawarkan jalan ke arah Masalah Asas Kesimpulan Sebab. Daripada cuba untuk menganggarkan kesan rawatan peringkat individu, kita boleh menganggarkan kesan rawatan rata - rata bagi semua unit:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Persamaan ini masih dinyatakan dari segi \(\tau_i\) , yang tidak dapat \(\tau_i\) , tetapi dengan beberapa algebra (eq 2.8 dari Gerber and Green (2012) ), kita dapat
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Ini menunjukkan bahawa jika kita dapat menganggarkan hasil purata populasi di bawah rawatan ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) dan hasil purata penduduk di bawah kawalan ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), maka kita dapat menganggarkan kesan rawatan rata-rata, walaupun tanpa menganggarkan kesan rawatan untuk orang tertentu.
Sekarang saya telah menentukan anggaran kami-perkara yang kita cuba anggaran-saya akan beralih kepada bagaimana kita boleh menganggarkannya dengan data. Dan di sini kita berjalan terus ke dalam masalah yang kita hanya melihat satu hasil yang berpotensi untuk setiap orang; kita lihat sama ada \(Y_i(0)\) atau \(Y_i(1)\) (jadual 2.6). Kita boleh menganggarkan kesan rawatan purata dengan membandingkan pendapatan orang yang berkhidmat kepada pendapatan orang yang tidak berkhidmat:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
di mana \(N_t\) dan \(N_c\) adalah bilangan orang dalam keadaan rawatan dan kawalan. Pendekatan ini akan berfungsi dengan baik jika tugasan rawatan adalah bebas daripada hasil yang berpotensi, suatu keadaan yang kadang-kadang dipanggil kebodohan . Malangnya, jika tidak ada eksperimen, kebodohan tidak selalunya berpuas hati, yang bermaksud bahawa penganggar dalam persamaan 2.4 tidak mungkin menghasilkan anggaran yang baik. Salah satu cara untuk memikirkannya ialah dengan tidak adanya peruntukan rawak rawatan, persamaan. 2.4 tidak membandingkan seperti seperti; ia membandingkan pendapatan pelbagai jenis orang. Atau dinyatakan sedikit berbeza, tanpa peruntukan rawatan rawak, peruntukan rawatan mungkin berkaitan dengan hasil yang berpotensi.
Dalam bab 4, saya akan menerangkan bagaimana percubaan terkawal rawak dapat membantu penyelidik membuat anggaran kausal, dan di sini saya akan menerangkan bagaimana para penyelidik boleh mengambil kesempatan daripada eksperimen semula jadi, seperti loteri draf.
Orang | Pendapatan dalam keadaan rawatan | Pendapatan dalam keadaan kawalan | Kesan rawatan |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Maksudnya | ? | ? | ? |
Eksperimen semulajadi
Satu pendekatan untuk membuat anggaran kausal tanpa menjalankan percubaan adalah untuk mencari sesuatu yang berlaku di dunia yang secara rawak memberikan rawatan untuk anda. Pendekatan ini dipanggil eksperimen semula jadi . Dalam banyak keadaan, sayangnya, alam semula jadi tidak secara rawak menyampaikan rawatan yang anda ingin populasikan. Tetapi kadang-kadang, alam semula jadi secara rawak menyampaikan rawatan yang berkaitan. Khususnya, saya akan mempertimbangkan kes di mana terdapat beberapa rawatan sekunder yang menggalakkan orang menerima rawatan utama . Sebagai contoh, draf itu boleh dianggap sebagai rawatan sekunder yang diberikan secara rawak yang menggalakkan sesetengah orang mengambil rawatan utama, yang berkhidmat dalam tentera. Reka bentuk ini kadang-kadang dipanggil reka bentuk galakan . Dan kaedah analisis yang akan saya jelaskan untuk menangani keadaan ini kadang-kadang dipanggil pembolehubah instrumental . Dalam penetapan ini, dengan beberapa anggapan, para penyelidik boleh menggunakan galakan untuk mempelajari tentang kesan rawatan utama untuk subset tertentu unit.
Untuk mengendalikan kedua-dua rawatan yang berlainan-galakan dan rawatan utama-kami memerlukan beberapa notasi baru. Katakan bahawa sesetengah orang secara rawak digubal ( \(Z_i = 1\) ) atau tidak digubal ( \(Z_i = 0\) ); dalam keadaan ini, \(Z_i\) kadangkala dipanggil alat .
Antara mereka yang telah digubal, ada yang berkhidmat ( \(Z_i = 1, W_i = 1\) ) dan ada yang tidak ( \(Z_i = 1, W_i = 0\) ). Begitu juga, antara mereka yang tidak digubal, ada yang berkhidmat ( \(Z_i = 0, W_i = 1\) ) dan ada yang tidak ( \(Z_i = 0, W_i = 0\) ). Hasil berpotensi untuk setiap orang kini boleh diperluas untuk menunjukkan status mereka untuk kedua-dua galakan dan rawatan. Contohnya, biarkan \(Y(1, W_i(1))\) menjadi pendapatan orang \(i\) jika dia digubal, di mana \(W_i(1)\) adalah status perkhidmatannya jika digubal. Selanjutnya, kita boleh membahagi penduduk menjadi empat kumpulan: penyusun, tidak pernah ada, pembela, dan pengambil (jadual 2.7).
Taipkan | Perkhidmatan jika digubal | Perkhidmatan jika tidak digubal |
---|---|---|
Pembekal | Ya, \(W_i(Z_i=1) = 1\) | Tidak, \(W_i(Z_i=0) = 0\) |
Jangan sekali-kali mengambil | Tidak, \(W_i(Z_i=1) = 0\) | Tidak, \(W_i(Z_i=0) = 0\) |
Pertahanan | Tidak, \(W_i(Z_i=1) = 0\) | Ya, \(W_i(Z_i=0) = 1\) |
Sentiasa mengambil | Ya, \(W_i(Z_i=1) = 1\) | Ya, \(W_i(Z_i=0) = 1\) |
Sebelum kita membincangkan menganggarkan kesan rawatan (iaitu, perkhidmatan ketenteraan), kita dapat terlebih dahulu mentakrifkan dua kesan galakan (iaitu, dirangka). Pertama, kita boleh menentukan kesan galakan pada rawatan utama. Kedua, kita boleh menentukan kesan galakan pada hasilnya. Akan ternyata bahawa kedua-dua kesan ini boleh digabungkan untuk memberikan anggaran kesan rawatan pada kumpulan orang tertentu.
Pertama, kesan galakan terhadap rawatan boleh ditakrifkan untuk orang \(i\) sebagai
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Selanjutnya, kuantiti ini dapat ditakrifkan ke atas seluruh penduduk sebagai
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Akhirnya, kita boleh menganggarkan \(\text{ITT} _{W}\) menggunakan data:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
dimana \(\bar{W}^{\text{obs}}_1\) adalah kadar rawatan yang diperhatikan bagi mereka yang digalakkan dan \(\bar{W}^{\text{obs}}_0\) kadar rawatan yang diperhatikan bagi mereka yang tidak digalakkan. \(\text{ITT}_W\) juga kadang-kadang dipanggil kadar pengambilan .
Seterusnya, kesan galakan pada hasilnya boleh ditakrifkan untuk orang \(i\) sebagai:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Selanjutnya, kuantiti ini dapat ditakrifkan ke atas seluruh penduduk sebagai
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Akhirnya, kita boleh menganggarkan \(\text{ITT}_{Y}\) menggunakan data:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
di mana \(\bar{Y}^{\text{obs}}_1\) adalah hasil yang diperhatikan (contohnya, pendapatan) bagi mereka yang digalakkan (contohnya, digubal) dan \(\bar{W}^{\text{obs}}_0\) adalah hasil yang diperhatikan bagi mereka yang tidak digalakkan.
Akhir sekali, kita mengalih perhatian kita kepada kesan minat: kesan rawatan primer (misalnya, perkhidmatan ketenteraan) ke atas hasil (misalnya, pendapatan). Malangnya, ternyata tidak dapat, pada umumnya, menganggarkan kesan ini pada semua unit. Walau bagaimanapun, dengan beberapa anggapan, para penyelidik boleh menganggarkan kesan rawatan pada pengadu (iaitu, orang yang akan berkhidmat jika digubal dan orang yang tidak akan berkhidmat jika tidak digubal, jadual 2.7). Saya akan panggil anggaran ini kesan purata kesan kausal (CACE) (yang juga kadang-kadang dipanggil kesan rawatan purata tempatan , LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
di mana \(G_i\) mendermakan kumpulan orang \(i\) (lihat jadual 2.7) dan \(N_{\text{co}}\) adalah bilangan penyusun. Dengan kata lain, persamaan 2.11 membandingkan pendapatan para pengadu yang dirangka \(Y_i(1, W_i(1))\) dan tidak digubal \(Y_i(0, W_i(0))\) . Anggaran dalam persamaan 2.11 seolah-olah sukar untuk menganggarkan dari data yang diperhatikan kerana tidak dapat mengenal pasti penghitung menggunakan hanya data yang diperhatikan (untuk mengetahui jika seseorang memenuhi syarat anda perlu memerhatikan sama ada dia berkhidmat semasa dirangka dan sama ada dia berkhidmat ketika tidak diolah).
Ternyata-agak mengejutkan-bahawa jika ada penyusun, maka disediakan satu membuat tiga asumsi tambahan, mungkin untuk mengestimasi CACE dari data yang diperhatikan. Pertama, seseorang perlu menganggap bahawa tugasan untuk rawatan adalah rawak. Dalam kes loteri draf ini adalah munasabah. Bagaimanapun, dalam beberapa tetapan di mana eksperimen semula jadi tidak bergantung kepada ragam fizikal, andaian ini mungkin lebih bermasalah. Kedua, kita harus mengandaikan bahawa mereka bukan penahan (asumsi ini kadang-kadang dinamakan asumsi monotonik). Dalam konteks draf itu nampaknya munasabah untuk menganggap bahawa terdapat sangat sedikit orang yang tidak akan berkhidmat jika digubal dan akan berkhidmat jika tidak digubal. Ketiga, dan akhirnya, menjadi asumsi yang paling penting yang dipanggil pengecualian pengecualian . Di bawah sekatan pengecualian, seseorang perlu mengandaikan bahawa semua kesan tugasan rawatan diteruskan melalui rawatan itu sendiri. Dalam erti kata lain, seseorang harus menganggap bahawa tidak ada kesan langsung dari galakan terhadap hasil. Dalam hal loteri draf, misalnya, seseorang perlu menganggap bahawa status draf tidak berpengaruh terhadap pendapatan selain melalui perkhidmatan ketenteraan (angka 2.11). Sekatan pengecualian boleh dilanggar jika, contohnya, orang yang telah digubal menghabiskan lebih banyak waktu di sekolah untuk menghindari layanan atau jika majikan kurang dapat mempekerjakan orang yang direkrut.
Sekiranya ketiga-tiga syarat ini (tugasan rawak ke rawatan, tiada penahan, dan sekatan pengecualian) dipenuhi, maka
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
jadi kita boleh menganggarkan CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
Salah satu cara untuk memikirkan CACE adalah bahawa ia adalah perbezaan hasil antara mereka yang digalakkan dan yang tidak digalakkan, meningkat dengan kadar pengambilan.
Terdapat dua peringatan penting untuk diingat. Sekatan sekatan pengecualian adalah satu asumsi yang kuat, dan ia perlu dibenarkan berasaskan kes demi kes, yang sering memerlukan kepakaran bidang subjek. Pembatasan pengecualian tidak dapat dibenarkan dengan rawak dari galakan. Kedua, cabaran praktikal yang biasa dengan analisa pembolehubah instrumental datang apabila galakan tidak mempunyai kesan ke atas pengambilan rawatan (apabila \(\text{ITT}_W\) adalah kecil). Ini dipanggil alat yang lemah , dan ia membawa kepada pelbagai masalah (Imbens and Rosenbaum 2005; Murray 2006) . Salah satu cara untuk memikirkan masalah dengan instrumen yang lemah ialah \(\widehat{\text{CACE}}\) boleh menjadi sensitif terhadap bias kecil dalam \(\widehat{\text{ITT}_Y}\) pelanggaran sekatan pengecualian-kerana kecenderungan ini diperbesar dengan kecil \(\widehat{\text{ITT}_W}\) (lihat persamaan 2.13). Secara kasar, jika rawatan yang diberikan oleh alam tidak mempunyai dampak besar pada perawatan yang anda peduli, maka anda akan mengalami kesulitan belajar tentang perawatan yang anda pedulikan.
Lihat Bab 23 dan 24 Imbens and Rubin (2015) untuk versi perbincangan yang lebih formal. Pendekatan ekonometrik tradisional kepada pemboleh ubah instrumental biasanya dinyatakan dari segi anggaran persamaan, bukan hasil yang berpotensi. Untuk pengenalan dari perspektif yang lain, lihat Angrist and Pischke (2009) , dan untuk perbandingan antara kedua-dua pendekatan, lihat seksyen 24.6 daripada Imbens and Rubin (2015) . Satu alternatif, penyampaian sedikit kurang formal mengenai pendekatan pembolehubah instrumental disediakan dalam bab 6 Gerber and Green (2012) . Untuk lebih lanjut mengenai sekatan pengecualian, lihat D. Jones (2015) . Aronow and Carnegie (2013) menerangkan satu set anggapan tambahan yang boleh digunakan untuk menganggarkan ATE daripada CACE. Untuk lebih lanjut mengenai bagaimana eksperimen semulajadi boleh menjadi sangat sukar untuk mentafsir, lihat Sekhon and Titiunik (2012) . Untuk pengenalan yang lebih umum kepada eksperimen semulajadi-satu yang melampaui pendekatan pemboleh ubah instrumental juga termasuk reka bentuk seperti kekacauan regresi-lihat Dunning (2012) .