Ushbu ilovada eksperimental ma'lumotlardan biroz ko'proq matematik shaklda natija chiqarib tashlash haqida ba'zi fikrlarni jamlayman. Ikkita asosiy yondashuv mavjud: asosan Judea Pearl va uning hamkasblari bilan bog'liq natsional grafika va Donald Rubin va hamkasblari bilan bog'liq bo'lishi mumkin bo'lgan natijalar doirasi. Men 3-4-boblarning oxirida matematik nashrlarda g'oyalar bilan yanada yaqinroq bo'lganligi uchun potentsial natijalar tizimini joriy qilaman. Natija grafikalar doirasi bo'yicha men Pearl, Glymour, and Jewell (2016) ( Pearl, Glymour, and Jewell (2016) ) va Pearl (2009) (rivojlangan). Mumkin bo'lgan natijalar doirasini va kosmik grafikani birlashtiradigan natija natijasini kitobni uzaytirish uchun Morgan and Winship (2014) tavsiya qilaman.
Ushbu qo'shimchaning maqsadi, ushbu mavzu bo'yicha yozilgan ba'zi texnik materiallarga o'tishga imkon berish uchun potentsial natijalar an'anasini eslatib turish va uslubingizni qulaylashtirishga yordam beradi. Birinchidan, men mumkin natijalar ramkasini tasvirlayman. Keyinchalik, Angrist (1990) tomonidan Angrist (1990) harbiy xizmatning daromadga ta'siri bo'yicha tabiiy tajribalarni muhokama qilish uchun foydalanaman. Ushbu ilovaga Imbens and Rubin (2015) .
Portlash natijalari
Olingan natijalar doirasi uchta asosiy elementga ega: birliklar , muolajalar va potentsial natijalar . Ushbu elementlarni tasvirlash uchun, Angrist (1990) da Angrist (1990) savolning stilize qilingan versiyasini ko'rib chiqaylik: harbiy xizmatning daromadga ta'siri qanday? Bunday holda biz Qo'shma Shtatlardagi 1970 yilgi qoralama uchun mos bo'lgan birliklarni belgilashimiz mumkin va biz bu kishilarni \(i = 1, \ldots, N\) indeksatsiyalashimiz mumkin. Bu holda davolash, men bu davolash va nazorat qilish sharoitlarini deb atayman ". Harbiy xizmat emas, balki" "harbiy xizmat" yoki bo'lishi mumkin, va men yozasiz \(W_i = 1\) odam, agar \(i\) davolash holatida va \(i\) nazorat holatida bo'lsa \(W_i = 0\) . Nihoyat, potentsial natijalar birmuncha kontseptual qiyinlashadi, chunki ular "salohiyatli" natijalarni o'z ichiga oladi; bo'lishi mumkin bo'lgan narsalar. 1970 yildagi loyihaga mos keladigan har bir inson uchun biz 1978 yilda harbiy xizmatda bo'lsalar, \(Y_i(1)\) oladigan bo'lsam, ular erishgan bo'lardi) 1978 yil harbiy xizmatga chaqirilmasa, men uni chaqiraman \(Y_i(0)\) . Mumkin natijalar doirasida \(Y_i(1)\) va \(Y_i(0)\) sobit miqdorlar, \(W_i\) esa tasodifiy o'zgaruvchi hisoblanadi.
Birliklarni tanlash, muolajalar va natijalarni tanqid qilish juda muhim, chunki u o'rganishdan nimani o'rganish mumkinligi va qanday qilib o'rganilishi mumkin emasligini belgilaydi. 1970 yildagi loyihalar uchun mos keladigan birliklarni tanlash - ayollarni o'z ichiga olmaydi, shuning uchun qo'shimcha taxminlarsiz, ushbu tadqiqot ayollarga harbiy xizmatning ta'siri haqida hech narsa aytmaydi. Muolajalar va natijalarni aniqlash bo'yicha qarorlar ham muhimdir. Misol uchun, qiziqish muomalasi harbiy xizmatda bo'lishga yoki jangovar vaziyatni boshdan kechirishga qaratilgan bo'lishi kerakmi? Qiziqishning natijasi daromad yoki ishni qondirishmi? Natijada, birliklarni tanlash, muolajalar va natijalarni tadqiqotning ilmiy va siyosiy maqsadlari boshqarishi kerak.
Birliklarni, muolajalarni va potentsial natijalarni tanlab olgan holda, davolanishni shaxs \(i\) , \(\tau_i\) ta'siri
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Boshqa so'zlar bilan aytganda, biz qancha odam solishtirish \(i\) ko'p odam qanday xizmat keyin kasb bo'lardi \(i\) xizmat holda kasb qilgan edi. Menga, eq. 2.1 natija ta'sirini aniqlashning eng aniq usuli va juda oddiy bo'lsa-da, bu ramka ko'pgina muhim va qiziqarli yo'llar bilan umumlashtiriladi (Imbens and Rubin 2015) .
Mumkin natijalar doirasini qo'llagan holda, men barcha bo'limlar uchun potentsial natijalarni va davolash effektlarini ko'rsatadigan jadvalni yozishni juda yaxshi bilaman (2.5-jadval). Agar siz bunday o'qish uchun bunday jadvalni tasavvur qila olmasangiz, unda sizning birliklaringiz, muolajalaringiz va potentsial natijalaringizning ta'riflarida aniqroq ma'lumotga ega bo'lishingiz mumkin.
Shaxs | Davolanish holatida daromad | Boshqarish holatidagi daromad | Davolash ta'siri |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Anglatadi | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Biroq, bu usulda nima sababdan ta'sir ko'rsatsak, biz muammoga duch kelamiz. Deyarli barcha holatlarda biz ikkala potentsial natijaga ham e'tibor bermaymiz. Ya'ni ma'lum bir kishi xizmat qilgan yoki xizmat qilmagan. Shuning uchun biz potentsial natijalarimizdan birini kuzatishimiz mumkin: \(Y_i(1)\) yoki \(Y_i(0)\) - ikkovi ham emas. Ham mumkin bo'lgan natijalarni kuzatish qobiliyatlari, Holland (1986) uni Natsional in'iktsiyaning asosiy muammo deb atagan eng katta muammo.
Yaxshiyamki, tadqiqot qilayotib, bizda faqat bir kishi yo'q; Aksincha, bizda ko'plab insonlar mavjud bo'lib, bu narsa sababiy tushkunlikning asosiy muammolari atrofida bir yo'l taklif qiladi. O'z-o'zini davolash darajasini baholashga urinishning o'rniga, barcha birliklar uchun o'rtacha davolash effektini taxmin qilishimiz mumkin:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Ushbu tenglama hali ham \(\tau_i\) jihatidan ifodalanadi, lekin ba'zi bir algebra ( \(\tau_i\) Gerber and Green (2012) 2.8 Gerber and Green (2012) ), biz
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Bu biz davolash ostida aholi o'rtacha natija taxmin mumkin, agar (ko'rsatadi \(N^{-1} \sum_{i=1}^N Y_i(1)\) va nazorati ostida aholi o'rtacha natija () \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), keyin har qanday muayyan shaxs uchun davolash effektini hisobga olmasdan turib, o'rtacha davo samarasini taxmin qilishimiz mumkin.
Endi biz hisob-kitobimizni aniqlab bergandik - biz taxmin qilmoqchi bo'lgan narsa - ma'lumotni qanday qilib biz uni qanday qilib baholashimiz mumkinligini bilib olamiz. Va bu erda biz har bir inson uchun potentsial natijalaridan faqat birini kuzatadigan muammoga to'g'ridan-to'g'ri yo'l qo'yamiz; \(Y_i(0)\) yoki \(Y_i(1)\) (jadval 2.6) ni ko'rib chiqamiz. Biz xizmat qilmagan odamlarning daromadiga xizmat qilgan kishilarning daromadlarini taqqoslash orqali o'rtacha davolanish effektini taxmin qilishimiz mumkin:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
qaerda \(N_t\) va \(N_c\) davolash va nazorat qilish sharoitida odamlarning soni. Bunday yondashuv, davolanishni tayinlash potentsial natijalar bilan bog'liq bo'lmasa, yaxshi ishlaydi, ba'zan e'tiborsizlik deb ataladigan holat. Afsuski, tajriba yo'qligida, bilmaslik tez-tez qondirilmaydi, demak, taxminiy tenglama. 2.4 yaxshi natijalarni bermayapti. Bu haqda mulohaza yuritishning bir usuli, davolanishning tasodifiy tayinlanishi bo'lmasa, 2.4 kabi o'xshash emas; u har xil turdagi odamlarning daromadlarini taqqoslaydi. Yoki tasodifiy tayinlanmasdan biroz boshqacha ifodalangan, davolashni taqsimlash potentsial natijalar bilan bog'liq.
4-bobda men tasodifiy nazorat ostida bo'lgan tajribalar tadqiqotchilarga natija bashorat qilishlariga qanday yordam berishi mumkinligini tasvirlayman va bu erda tadqiqotchilar lotereya kabi loyihalar kabi tabiiy tajribalardan qanday foydalanishi mumkinligini tasvirlayman.
Shaxs | Davolanish holatida daromad | Boshqarish holatidagi daromad | Davolash ta'siri |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Anglatadi | ? | ? | ? |
Tabiiy tajribalar
Eksperiment o'tkazmasdan natija bashorat qilish uchun bir yondashuv, dunyoda tasodifiy siz uchun davolanadigan biror narsalarni izlashdir. Ushbu yondashuv tabiiy tajriba deb ataladi. Ko'pgina hollarda, afsuski, tabiat siz qiziqishli aholiga kerakli davolanishni tasodifiy taslim qilmaydi. Lekin ba'zida tabiat tasodifiy munosabatda bo'ladi. Ayniqsa, davolanishni odamlarga birinchi darajali davolanishga undayotgan ba'zi ikkilamchi davolanishlarni ko'rib chiqaman. Masalan, loyiha tasodifiy tayinlangan ikkinchi darajali davolanish deb hisoblanishi mumkin edi, bu esa ayrim odamlarni harbiy xizmatda bo'lgan asosiy davolashni qo'llashga undadi. Ushbu dizayn ba'zan dalda beruvchi dizayn deb ataladi. Va bu vaziyatni tahlil qilish usulini tahlil qilish uslubi ba'zan asboblar o'zgaruvchilari deb ataladi. Ushbu sharoitda, ayrim taxminlar bilan, tadqiqotchilar, muayyan bir kichik guruh uchun asosiy davolash samaradorligini o'rganish uchun dalda foydalanishlari mumkin.
Ikkita turli xil muolajalar - ruhlantiruvchi va dastlabki davolanish uchun - biz yangi bir nishonga muhtojmiz. Tasavvur qiling, ba'zi odamlar tasodifiy tuzilgan ( \(Z_i = 1\) ) yoki tayyorlanmagan ( \(Z_i = 0\) ); Bu holda, \(Z_i\) ba'zan asbob deb ataladi.
\(Z_i = 1, W_i = 1\) ba'zilari ( \(Z_i = 1, W_i = 1\) ) va ba'zilari ( \(Z_i = 1, W_i = 0\) ) xizmat qildi. Xuddi shunday, tayyorlanmaganlar orasida ba'zilari ( \(Z_i = 0, W_i = 1\) ) va ba'zilari ( \(Z_i = 0, W_i = 0\) ) xizmat qildi. Kelajakda har bir inson uchun potentsial natijalar, ularning rag'batlantirish va davolash uchun maqomini ko'rsatish uchun kengaytirilishi mumkin. Misol uchun, ijozat \(Y(1, W_i(1))\) shaxs daromad bo'lishi \(i\) u qaerda, yaratilgan bo'lsa, \(W_i(1)\) ishlab, agar uning xizmat holati hisoblanadi. Bundan tashqari, biz aholini to'rt guruhga ajratishimiz mumkin: komponentlar, hech qachon olmaydiganlar, defierslar va har doim (jadval 2.7).
Turi | Agar tuzilgan bo'lsa xizmat | Xizmat tayyorlanmagan bo'lsa |
---|---|---|
Tuzuvchilar | Ha, \(W_i(Z_i=1) = 1\) | Yo'q, \(W_i(Z_i=0) = 0\) |
Hech qachon yo'q | Yo'q, \(W_i(Z_i=1) = 0\) | Yo'q, \(W_i(Z_i=0) = 0\) |
Defiers | Yo'q, \(W_i(Z_i=1) = 0\) | Ha, \(W_i(Z_i=0) = 1\) |
Doimo yolg'izlar | Ha, \(W_i(Z_i=1) = 1\) | Ha, \(W_i(Z_i=0) = 1\) |
Davolanishni (ya'ni, harbiy xizmat) ta'sirini baholashni muhokama qilishdan oldin, avvalo, biz rag'batlantirishning ikkita ta'sirini (ya'ni, ishlab chiqilgan) aniqlashimiz mumkin. Birinchidan, biz birinchi darajali davolanishni rag'batlantirishning ta'sirini aniqlashimiz mumkin. Ikkinchidan, dalda beruvchi natijaning samarasini aniqlashimiz mumkin. Bu ikki ta'sirni davolanishni muayyan odam guruhiga ta'sirini baholash uchun birlashtirishi mumkin bo'ladi.
Birinchidan, davolanishni rag'batlantirish ta'siri inson uchun \(i\) sifatida aniqlanishi mumkin
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Bundan tashqari, bu miqdor butun aholiga nisbatan aniqlanishi mumkin
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Nihoyat, biz \(\text{ITT} _{W}\) ma'lumotlaridan foydalanib hisoblashimiz mumkin:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
\(\bar{W}^{\text{obs}}_1\) , bu da'vat qilingan va \(\bar{W}^{\text{obs}}_0\) rag'batlantirilmagan shaxslar uchun davolashning kuzatilgan darajasi. \(\text{ITT}_W\) da ba'zan olish darajasi deb ataladi.
Keyinchalik, natijaga erishish uchun rag'batlantirishning ta'siri inson \(i\) uchun quyidagi tarzda aniqlanishi mumkin:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Bundan tashqari, bu miqdor butun aholiga nisbatan aniqlanishi mumkin
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Nihoyat, ma'lumotlardan foydalanib \(\text{ITT}_{Y}\) mumkin:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
qaerda \(\bar{Y}^{\text{obs}}_1\) , da'vat etilganlar uchun (masalan, ishlab chiqilgan) va \(\bar{W}^{\text{obs}}_0\) - bu da'vat etilmagan kishilar uchun kuzatilgan natijadir.
Nihoyat, biz diqqatimizni qiziqishning ta'siriga qaratamiz: birinchi darajali davolanishning natijasi (masalan, harbiy xizmat) oqibatlarga (masalan, daromadlar). Afsuski, odatda, bu ta'sirni barcha birliklarga kiritish mumkin emas. Biroq ba'zi taxminlarga ko'ra, tadqiqotchilar davolashni tuzuvchilarga ta'sirini (masalan, tuzilgan bo'lsa xizmat qiladigan odam va agar ishlab chiqilmagan bo'lsa xizmat qiladigan odamlar, 2.7-jadval) ta'sirini baholashlari mumkin. Men ushbu taxminni va (bu erda ba'zan mahalliy o'rtacha davolovchi effekt , LATE deb ataladi) o'rtacha darajadagi natija ta'sirini (CACE) chaqiraman :
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
\(G_i\) inson guruhini \(i\) \(G_i\) xayr-ehson qiladi (2.7-jadvalga qarang) va \(N_{\text{co}}\) komponentlar soni. Boshqacha aytganda, eq. 2.11 \(Y_i(1, W_i(1))\) tuzilgan va tayyorlanmagan \(Y_i(0, W_i(0))\) . Taxminan hisobda. 2.11 kuzatilgan ma'lumotlardan tasavvur qilish qiyin bo'lib ko'rinadi, chunki faqatgina kuzatilgan ma'lumotlardan foydalanib, kompilyatorlarni aniqlash mumkin emas (agar kimdir sizning tuzilgan vaqtda xizmat qilgan-qilmagani va u tayyorlanmagan bo'lsa, xizmat qiladimi-yo'qmi kuzatishi kerak).
Ko'rinib turibdiki, agar biron bir komponent mavjud bo'lsa, u holda uchta qo'shimcha taxminlar mavjud bo'lsa, CACEni kuzatilgan ma'lumotlardan baholash mumkin. Birinchidan, davolanish topshirig'i tasodifiy ekanligini tasavvur qilish kerak. Lotereya loyihasi uchun bu maqbuldir. Biroq, tabiiy tajribalar fizik randomizatsiyaga tayanmagan ayrim sharoitlarda bu taxmin yanada muammoli bo'lishi mumkin. Ikkinchidan, ularning hech bir defieri yo'q deb hisoblash kerak (bu taxmin ham ba'zan monotoniklik taxmin). Loyihaning mazmuni bo'yicha loyiha tayyorlanmasa xizmat qilmasa xizmat qiladigan juda oz odamlar borligini taxmin qilish oqilonadir. Uchinchidan, nihoyat, cheklashlar deb ataluvchi eng muhim taxmin. Cheklov chekloviga ko'ra, davolanish topshirig'ining barcha ta'siri davolanish yo'li bilan o'tishi kerak. Boshqa so'z bilan aytganda, natijalarni rag'batlantirishning bevosita ta'siri yo'q deb hisoblash kerak. Lotereya loyihasi uchun, masalan, loyiha maqomi harbiy xizmatdan boshqa daromadga ta'sir qilmaydi, deb taxmin qilish kerak (2.11-rasm). Masalan, tayyorlangan kishilar xizmatdan qochish uchun ko'proq vaqt sarflagan yoki ish beruvchilar ish bilan band bo'lgan odamlarni ishga yollash imkoni bo'lmagan taqdirda, cheklovni buzish mumkin.
Agar bu uch holat (davolanishni tasodifiy tayinlash, defieri yo'q va cheklashlar) bajarilmasa
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
shuning uchun biz CACEni baholashimiz mumkin:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
CACE haqida o'ylashning bir usuli shundaki, u da'vat etilgan va da'vat etilmagan kishilarning natijalaridan farq qiladi.
Yodda tutish kerak bo'lgan ikki muhim ogohlantirish mavjud. Birinchidan, cheklash taqiqlash kuchli taxmin bo'lib, u odatda mavzu bo'yicha tajriba talab qiladigan har bir holatda asoslanishi kerak. Cheklovni cheklashni rag'batlantirishni tasodifiy qilish bilan oqlash mumkin emas. Ikkinchidan, instrumental o'zgarmaydigan tahlil qilish bilan keng tarqalgan amaliy mashg'ulotlar rag'batlantirish davolanishga kam ta'sir qiladi (qachon \(\text{ITT}_W\) kichik). Bu zaif vosita deb ataladi va bu turli muammolarga olib keladi (Imbens and Rosenbaum 2005; Murray 2006) . Zaif asboblar bilan bog'liq muammo haqida o'ylashning usullaridan biri, \(\widehat{\text{CACE}}\) \(\widehat{\text{ITT}_Y}\) xatti-harakatlariga sezgir bo'lishi mumkin. cheklashlarni bekor qilish - chunki bu taxminlar kichik \(\widehat{\text{ITT}_W}\) (Qarang-modda 2.13). Shunga qaramay, agar siz tabiatan tayinlagan muolajalar sizga g'amxo'rlik qilayotgan davolanishga katta ta'sir o'tkazmasa, siz o'zingiz g'amxo'rlik qilayotgan davolanishni o'rganishingiz qiyin kechadi.
Imbens and Rubin (2015) 23 va 24- Imbens and Rubin (2015) qarang, bu muhokamaning yana rasmiy versiyasi. Instrumental parametrlarga an'anaviy ekonometrik yondashuv odatda potentsial natijalarga emas, balki tenglamalarni baholashda ifodalanadi. Boshqa nuqtai nazardan kirish uchun Angrist and Pischke (2009) ga qarang va ikki yondashuv o'rtasidagi taqqoslash uchun Imbens and Rubin (2015) 24.6 bo'limiga qarang. Instrumental parametrlarga muqobil, biroz kamroq rasmiy taqdimot Gerber and Green (2012) 6-bobida keltirilgan. Qoidabuzarliklarni cheklash haqida ko'proq ma'lumot olish uchun D. Jones (2015) -ga qarang. Aronow and Carnegie (2013) CACEni emas, balki ATEni baholash uchun ishlatilishi mumkin bo'lgan qo'shimcha taxminlar majmuasini tasvirlaydi. Tabiiy eksperimentlar qanday talqin qilinishi juda qiyin bo'lishi mumkin, batafsilroq ma'lumot uchun Sekhon and Titiunik (2012) . Tabiiy tajribalar haqida umumiyroq ma'lumot olish uchun - faqatgina regression uzilishlar kabi dizaynlarni o'z ichiga oluvchi instrumental parametrlarga yondashishdan tashqari - Dunning (2012) ga qarang.