در این ضمیمه، من بعضی از ایده ها در مورد ایجاد نتیجه گیری علی را از داده های غیر تجربی در فرم کمی بیشتر ریاضی خلاصه می کنم. دو رویکرد اصلی وجود دارد: چارچوب نمودار علی، بیشتر مربوط به یهودا مروارید و همکاران و چارچوب نتایج بالقوه است که بیشتر با دونالد روبین و همکاران مرتبط است. من چارچوب نتایج بالقوه را معرفی خواهم کرد زیرا آن را بیشتر در ارتباط با ایده های یادداشت های ریاضی در انتهای فصل 3 و 4 بیشتر مرتبط می سازد. برای بیشتر در مورد چارچوب نمودارهای علیت، من پیشنهاد می کنم Pearl, Glymour, and Jewell (2016) (مقدماتی ) و Pearl (2009) (پیشرفته). من برای Morgan and Winship (2014) توصیه میکنم برای درمان طولانی مدت نتیجه استدلال علی که ترکیبی از چارچوب نتایج بالقوه و چارچوب گراف علیت است.
هدف این افزونه این است که به شما کمک کند با نشانه گذاری و سبک سنت های بالقوه نتایج به راحتی دست پیدا کنید تا بتوانید به برخی از مطالب فنی بیشتر در این موضوع انتقال دهید. اولا، چارچوب نتایج بالقوه را توصیف می کنم. سپس، من از آن برای بحث در مورد آزمایش های طبیعی مانند یک توسط Angrist (1990) در مورد تأثیر خدمات نظامی بر درآمد بحث خواهم کرد. این Imbens and Rubin (2015) به شدت بر روی Imbens and Rubin (2015) .
چارچوب نتایج بالقوه
چارچوب نتایج بالقوه دارای سه عنصر اصلی است: واحد ، درمان ، و نتایج بالقوه . به منظور نشان دادن این عناصر، بیایید یک نسخه تلطیف شده از سوال مطرح شده در Angrist (1990) در نظر Angrist (1990) : تأثیر خدمات نظامی بر درآمد چیست؟ در این مورد، ما می توانیم واحدهای را برای افرادی که واجد شرایط برای پیش نویس 1970 در ایالات متحده هستند تعریف کنیم، و ما می توانیم این افراد را با \(i = 1, \ldots, N\) . درمان در این مورد می تواند "خدمت در ارتش" و یا "در ارتش خدمت نیست." من این شرایط درمان و کنترل تماس بگیرید، و من ارسال \(W_i = 1\) اگر فرد \(i\) در شرایط درمان و \(W_i = 0\) اگر فرد \(i\) در شرایط کنترل است. در نهایت، نتایج بالقوه مفهومی پیچیده تر است زیرا آنها نتایج "بالقوه" را شامل می شوند؛ چیزهایی که می توانست اتفاق بیفتد. برای هر فرد واجد شرایط برای پیش نویس سال 1970، ما می توانیم مبلغی را که در سال 1978 به دست آورده بود، در صورت خدمت در ارتش، که من آن را \(Y_i(1)\) و مبلغی که آنها در 1978 اگر آنها در ارتش خدمت نکنند، که من آن را خواهم \(Y_i(0)\) . در چارچوب نتایج بالقوه، \(Y_i(1)\) و \(Y_i(0)\) مقادیر ثابت هستند، در حالی که \(W_i\) یک متغیر تصادفی است.
انتخاب واحدها، درمان ها و نتایج بسیار مهم است زیرا تعریف می کند که چه چیزی می تواند و نمی تواند از مطالعه آموخته شود. انتخاب واحدها - افرادی که واجد شرایط برای پیش نویس سال 1970 هستند - شامل زنان نمی شود و بنابراین بدون فرض های اضافی، این مطالعه ما هیچ چیز در مورد تاثیر خدمات نظامی بر زنان نمی دهد. تصمیمات در مورد چگونگی تعریف درمانها و نتایج مهم نیز هست. به عنوان مثال، آیا درمان علاقه به تمرکز بر خدمت در ارتش یا مبارزه با آن متمرکز باشد؟ آیا نتیجه سود باید درآمد یا رضایت شغلی باشد؟ در نهایت، انتخاب واحدها، درمان ها و نتایج باید با اهداف علمی و سیاستی مطالعه انجام شود.
با توجه به انتخاب واحدها، درمان ها و نتایج بالقوه، اثر علمی درمان در فرد \(i\) ، \(\tau_i\) ،
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
به عبارت دیگر، ما مقایسه می کنیم که چقدر فرد \(i\) پس از خدمت به دست آورده است، چقدر فرد \(i\) بدون خدمت به دست آورده است. به من عدالت 2.1 روشن ترین راه برای تعریف یک اثر علی است و اگر چه بسیار ساده است، این چارچوب در بسیاری از مهم و جالب به نظر می رسد (Imbens and Rubin 2015) .
با استفاده از چارچوب نتایج بالقوه، من اغلب مفید است که یک جدول را که نتایج بالقوه و اثرات درمان برای همه واحدها را نشان می دهد، بنویسید (جدول 2.5). اگر نمیتوانید چنین جدولی برای مطالعه خود را تصور کنید، ممکن است لازم باشد که در تعاریف واحدهای خود، درمانها و نتایج بالقوه دقیقتر باشید.
فرد | درآمد در شرایط درمان | درآمد در شرایط کنترل | اثر درمان |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
منظور داشتن | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
با این حال، هنگامی که اثرات علی را مشخص می کنیم، ما به یک مشکل مواجه می شویم. تقریبا در همه موارد، ما نمی توانیم هر دو نتایج بالقوه را مشاهده کنیم. بدین معنی است که فرد خاصی خدمت کرده یا خدمت نکرده است. بنابراین، ما یکی از نتایج بالقوه را مشاهده می کنیم - \(Y_i(1)\) یا \(Y_i(0)\) اما نه هر دو. ناتوانی در رعایت هر دو نتیجه بالقوه، یک مشکل اساسی است که Holland (1986) آن را مسئله اساسی استنتاج عقلانی نامید.
خوشبختانه، وقتی تحقیق می کنیم، فقط یک نفر را نداریم؛ در عوض، ما بسیاری از مردم داریم، و این راه حل را درمورد مسئله اساسی استنباط علیت ارائه می دهد. به جای تلاش برای برآورد اثر درمان در سطح فردی، می توانیم میانگین اثر درمان را برای تمام واحدها برآورد کنیم:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
این معادله هنوز در رابطه با \(\tau_i\) که قابل مشاهده نیستند، اما با برخی از جبر (معادل 2.8 از Gerber and Green (2012) )، ما دریافت می کنیم
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
این نشان می دهد که اگر می توانیم نتیجه میانگین میانگین تحت درمان ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) و نتیجه میانگین میانگین تحت کنترل ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) )، پس می توانیم میانگین اثر درمان را حتی بدون برآورد اثر درمان برای هر فرد مشخص کنیم.
حالا که من برآورد کرده ام - چیزی که ما در حال تلاش برای برآوردن آن هستیم - من به چگونگی واقعی آن را با داده ها ارزیابی خواهیم کرد. و در اینجا ما به طور مستقیم به مسئله ای که ما تنها یکی از نتایج بالقوه را برای هر فرد می بینیم، اجرا می کنیم؛ ما می بینیم که \(Y_i(0)\) یا \(Y_i(1)\) (جدول 2.6). ما می توانیم اثربخشی درمان متوسط را با مقایسه درآمد افرادی که به درآمد افرادی که خدمت نکردند، برآورد کنیم.
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
جایی که \(N_t\) و \(N_c\) تعداد افراد در شرایط درمان و کنترل است. این رویکرد به خوبی کار خواهد کرد اگر تخصیص درمان مستقل از نتایج بالقوه باشد، وضعیتی که گاهی اوقات ناموفق بودن نامیده می شود. متاسفانه، در غیاب یک آزمایش، نادیده گرفتن اغلب راضی نیست، بدان معنی است که برآوردگر در معادله. 2.4 به احتمال زیاد برآورد خوبی تولید نمی کند. یک راه برای فکر کردن درباره آن این است که در غیاب انتساب تصادفی درمان، Equ. 2.4 مانند مقایسه با مقایسه نیست این مقایسه درآمد افراد مختلف است. یا بیان کمی متفاوت، بدون تصادف اختصاص درمان، تخصیص درمان احتمالا مربوط به نتایج بالقوه است.
در فصل 4، من توضیح خواهم داد که چگونه آزمایش های کنترل شده به صورت تصادفی می توانند به محققان برآوردهای علمی را کمک کنند، و در اینجا خواهم نوشت که چگونه محققان می توانند از آزمایش های طبیعی مانند پیش نویس قرعه کشی استفاده کنند.
فرد | درآمد در شرایط درمان | درآمد در شرایط کنترل | اثر درمان |
---|---|---|---|
1 | ؟ | \(Y_1(0)\) | ؟ |
2 | \(Y_2(1)\) | ؟ | ؟ |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ؟ | ؟ |
منظور داشتن | ؟ | ؟ | ؟ |
آزمایشات طبیعی
یک رویکرد به برآوردهای علی بدون انجام یک آزمایش، یافتن چیزی است که در جهان اتفاق می افتد که به طور تصادفی برای شما درمان شده است. این رویکرد، آزمایش های طبیعی است . در بسیاری از موارد، متاسفانه، طبيعت به طور تصادفی درماني را که شما ميخواهيد به نفع مردم انجام دهد ارائه ندهيد. اما گاهی طبیعت به طور تصادفی یک درمان مرتبط را ارائه می دهد. به ویژه، من این مورد را در نظر می گیرم که در آن درمان ثانویه وجود دارد که مردم را تشویق می کند تا درمان اولیه را دریافت کنند. به عنوان مثال، پیش نویس می تواند یک تصادفی مجزا ثانویه در نظر گرفته شود که برخی افراد را تشویق می کند تا درمان اولیه را که در ارتش خدمت می کنند، بپذیرد. این طراحی گاهی اوقات طراحی تشویق می شود . و روش تجزیه و تحلیل که من توصیف می کنم برای رسیدگی به این وضعیت گاهی اوقات به عنوان متغیرهای ابزار شناخته می شود . در این زمینه، با برخی از فرضیه ها، محققان می توانند از تشویق برای درک تاثیر درمان اولیه برای یک زیرمجموعه واحد استفاده کنند.
برای رسیدگی به دو روش مختلف - تشویق و درمان اولیه - ما نیاز به نشانه های جدید داریم. فرض کنید برخی افراد به طور تصادفی طراحی شده اند ( \(Z_i = 1\) ) یا پیش نویس نمی شوند ( \(Z_i = 0\) )؛ در این وضعیت، \(Z_i\) گاهی به عنوان یک ابزار شناخته می شود .
در میان کسانی که پیش نویس شده بودند، بعضی از آنها خدمت کردند ( \(Z_i = 1, W_i = 1\) ) و بعضی از آنها ( \(Z_i = 1, W_i = 0\) ) \(Z_i = 1, W_i = 0\) . به همین ترتیب، در میان افرادی که پیش نویس نشده بودند، بعضی از آنها ( \(Z_i = 0, W_i = 1\) ) و برخی ( \(Z_i = 0, W_i = 0\) ) خدمت کردند. نتایج بالقوه برای هر فرد اکنون می تواند گسترش یابد تا موقعیت خود را برای تشویق و درمان نشان دهد. به عنوان مثال، اجازه دهید \(Y(1, W_i(1))\) درآمد شخص \(i\) اگر او تهیه شده بود، جایی که \(W_i(1)\) وضعیت سرویس او در صورت تهیه است. علاوه بر این، ما می توانیم جمعیت را به چهار گروه تقسیم کنیم: سازندگان، هرگز گیرنده ها، مدافعان و همیشه گیرندگان (جدول 2.7).
تایپ کنید | خدمات اگر پیش نویس باشد | خدمات اگر طرح نباشد |
---|---|---|
نرم افزارها | بله، \(W_i(Z_i=1) = 1\) | نه، \(W_i(Z_i=0) = 0\) |
هرگز گیرنده نیست | نه، \(W_i(Z_i=1) = 0\) | نه، \(W_i(Z_i=0) = 0\) |
مدافعان | نه، \(W_i(Z_i=1) = 0\) | بله، \(W_i(Z_i=0) = 1\) |
همیشه گیرنده ها | بله، \(W_i(Z_i=1) = 1\) | بله، \(W_i(Z_i=0) = 1\) |
قبل از اینکه ما درباره برآورد اثر درمان (یعنی خدمات نظامی) بحث کنیم، ابتدا می توانیم دو اثر تشویقی (یعنی پیش نویس) را تعریف کنیم. اولا می توانیم تأثیر تشویق بر درمان اولیه را تعریف کنیم. دوم، ما می توانیم تأثیر تشویق بر نتیجه را تعریف کنیم. به نظر می رسد که این دو اثر را می توان ترکیب کرد تا برآوردی از تاثیر درمان بر روی یک گروه خاصی از مردم را ارائه دهد.
اول، تأثیر تشویق بر درمان را می توان برای فرد \(i\) as تعریف کرد
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
علاوه بر این، این مقدار را می توان بر تمام جمعیت به عنوان
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
در نهایت می توانیم \(\text{ITT} _{W}\) با استفاده از داده ها را ارزیابی کنیم:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
\(\bar{W}^{\text{obs}}_1\) ، میزان مشاهده شده درمان برای کسانی است که تشویق شده اند و \(\bar{W}^{\text{obs}}_0\) میزان مشاهده درمان برای کسانی که تشویق نشده بودند. \(\text{ITT}_W\) نیز گاهی اوقات میزان جذب نامیده می شود.
بعد، تأثیر تشویق بر نتیجه می تواند برای فرد \(i\) شود:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
علاوه بر این، این مقدار را می توان بر تمام جمعیت به عنوان
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
در نهایت می توانیم \(\text{ITT}_{Y}\) با استفاده از داده ها را ارزیابی کنیم:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
\(\bar{Y}^{\text{obs}}_1\) نتیجهی مشاهده شده (به عنوان مثال، درآمد) برای کسانی که تشویق شده اند (به عنوان مثال پیش نویس) و \(\bar{W}^{\text{obs}}_0\) نتیجه مشاهده شده برای کسانی است که تشویق نشده اند.
در نهایت، ما توجه خود را به تأثیر توجه می کنیم: اثر درمان اولیه (به عنوان مثال، خدمات نظامی) بر نتیجه (مثلا درآمد). متأسفانه، معلوم می شود که به طور کلی این اثر را نمی توان بر تمام واحدها تخمین زد. با این حال، با برخی از فرضیه ها، محققان می توانند تأثیر درمان بر صاحب نظران (یعنی افرادی که در صورت تهیه پیش نویس و افرادی که در صورت عدم ارائه، جدول 2.7 را ارائه می دهند) تخمین زده شود. من این برآورد می کنم و به طور متوسط اثرات عارضه قضاوت کننده (CACE) (که بعضی اوقات نیز به عنوان اثر متداول درمان محلی ، LATE نامیده می شود):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
جایی که \(G_i\) گروهی از فرد \(i\) \(G_i\) اهدا میکند (نگاه کنید به جدول 2.7) و \(N_{\text{co}}\) N_ \(N_{\text{co}}\) تعدادی از compliers است. به عبارت دیگر، معادل 2.11 درآمد صاحبنظران را که پیشنهادی دارند \(Y_i(1, W_i(1))\) و پیش نویس ندارد \(Y_i(0, W_i(0))\) . برآورد در معادله 2.11 به نظر می رسد که از داده های مشاهدات بسیار دشوار است زیرا نمیتوان تشخیص دهندگان را با استفاده از داده های مشاهده کرد (بدانید که آیا کسی قضاوت می کند یا خیر، باید توجه داشته باشید که آیا در هنگام تهیه پیش نویس خدمت کرده یا خیر.
معلوم می شود که تا حدودی شگفت آور است - اگر هر قاعده ای وجود داشته باشد، پس از ارائه یک فرضیه دیگر، ممکن است CACE را از داده های مشاهده شده برآورد کند. اولا باید فرض کنیم که انتساب به درمان تصادفی است. در مورد پیش نویس قرعه کشی این معقول است. با این حال، در برخی از تنظیمات که آزمایش های طبیعی به تصادفات فیزیکی وابسته نیستند، این فرض ممکن است مشکل تر باشد. دوم، باید فرض کنیم که آنها هیچ مدعی هستند (این فرض نیز گاهی اوقات به عنوان فرض تک تنه) نامیده می شود. در چارچوب پیش نویس، منطقی است که فرض کنیم که تعداد کمی از افراد وجود دارند که در صورت تهیه پیش نویس خدمت نخواهند کرد و اگر طرح نکنند، خدمت می کنند. سوم، و در نهایت، مهمترین فرضیه است که محدودیت خروج نامیده می شود . تحت محدودیت محرومیت، باید فرض کنیم که تمام اثر درمان اختصاص داده شده از طریق درمان به تصویب رسید. به عبارت دیگر، باید فرض کنیم که تأثیر مستقیمی بر تشویق بر نتایج وجود ندارد. به عنوان مثال، در مورد قرعه کشی قرعه کشی پیش بینی می شود که وضعیت پیش نویس تاثیری بر درآمد غیر از خدمات نظامی ندارد (شکل 2.11). محدودیت محرومیت میتواند نقض شود، برای مثال، افرادی که پیش نویس شده بودند، زمان بیشتری را در مدرسه برای صرفنظر کردن از خدمات صرف کردند و یا اگر کارفرمایان کمترین احتمال استخدام افرادی را داشتند که طراحی شده بودند.
اگر این سه شرط (انتساب تصادفی به درمان، هیچ مدافع و محدودیت محرومیت) برآورده شود، سپس آن را انجام دهید
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
بنابراین می توانیم CACE را تخمین بزنیم:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
یک راه برای فکر کردن در مورد CACE این است که تفاوت در نتایج بین کسانی که تشویق شده اند و کسانی که تشویق نمی شوند، توسط نرخ جذب بالا می شود.
دو نکته مهم وجود دارد که باید در ذهن داشته باشید: اولا، محدودیت محرومیت یک فرض قوی است و باید براساس یک مورد بر اساس یک تقاضا موجه باشد، که اغلب به تخصص موضوع حوزه نیاز دارد. محدودیت محرومیت با تصادف تشویق قابل توجیه نیست. دوم، چالش عملی مشترک با تجزیه و تحلیل متغیر ابزار، زمانی است که تشویق تأثیر کمی بر پذیرش درمان دارد (زمانی که \(\text{ITT}_W\) کوچک است). این یک ابزار ضعیف است و منجر به مشکالت مختلفی می شود (Imbens and Rosenbaum 2005; Murray 2006) . یک راه برای فکر کردن به مشکل با ابزارهای ضعیف این است که \(\widehat{\text{CACE}}\) میتواند به تغییرات کوچک در \(\widehat{\text{ITT}_Y}\) حساس باشد نقض محدودیت حذف - به این دلیل که این تعصبات با کوچک \(\widehat{\text{ITT}_W}\) (نگاه کنید به معادل 2.13). به طور تقریبی، اگر درمان که طبیعت اختصاص می دهد تاثیر زیادی در درمان شما در مورد مراقبت نیست، و سپس شما می خواهید به سختی یادگیری در مورد درمان شما مورد توجه است.
فصل 23 و 24 Imbens and Rubin (2015) برای نسخه رسمی این بحث مشاهده کنید. رویکرد اقتصادسنجی سنتی به متغیرهای ابزار معمولا از نظر برآورد معادلات، و نه نتایج بالقوه بیان می شود. برای مقدمه ای از این دیدگاه دیگر، Angrist and Pischke (2009) و برای مقایسه بین دو روش، بخش 24.6 Imbens and Rubin (2015) . یک جایگزین، کمی نسبتا رسمی ارائه رویکرد متغیرهای ابزار در فصل 6 از Gerber and Green (2012) . برای اطلاعات بیشتر در مورد محدودیت محرومیت، به D. Jones (2015) . Aronow and Carnegie (2013) مجموعه ای از مفروضاتی را ارائه می دهند که می توانند برای تخمین ATE به جای CACE استفاده شوند. برای اطلاعات بیشتر در مورد اینکه چگونه آزمایش های طبیعی برای تفسیر بسیار دشوار است، نگاه کنید به Sekhon and Titiunik (2012) . برای یک معرفی کلی تر به آزمایش های طبیعی - که فراتر از رویکرد متغیرهای ابزاربندی می شود، شامل طرح هایی نظیر انقباض رگرسیون (see Dunning (2012) .