في هذا التذييل ، سأوجز بعض الأفكار حول جعل الاستدلال السببي من البيانات غير التجريبية في شكل رياضي أكثر قليلاً. هناك طريقتان رئيسيتان: إطار الرسم البياني السببية ، الأكثر ارتباطًا بجزر يهودا بيرل وزملائه ، وإطار النتائج المحتملة ، الأكثر ارتباطًا مع دونالد روبين وزملائه. سوف أعرض إطار النتائج المحتملة لأنه أكثر ارتباطاً بالأفكار الواردة في الملاحظات الرياضية في نهاية الفصل 3 و 4. لمزيد من المعلومات حول إطار الرسوم البيانية السببية ، أوصي Pearl, Glymour, and Jewell (2016) (المقدمة ) Pearl (2009) (متقدم). من أجل معالجة طول الكتاب من الاستدلال السببي الذي يجمع بين إطار النتائج المحتملة وإطار الرسم البياني السببية ، أوصي Morgan and Winship (2014) .
الهدف من هذا الملحق هو مساعدتك في الحصول على ارتياح مع طريقة وأسلوب التقاليد المحتملة للنتائج حتى يمكنك الانتقال إلى بعض المواد الفنية الأكثر كتابة حول هذا الموضوع. أولا ، سوف أصف إطار النتائج المحتملة. ثم ، Angrist (1990) لمناقشة التجارب الطبيعية مثل تلك التي Angrist (1990) حول تأثير الخدمة العسكرية على الأرباح. يعتمد هذا الملحق بشكل كبير على Imbens and Rubin (2015) .
إطار النتائج المحتملة
يشتمل إطار النتائج المحتملة على ثلاثة عناصر رئيسية: الوحدات والعلاجات والنتائج المحتملة . من أجل توضيح هذه العناصر ، دعنا نفكر في نسخة مبسطة من السؤال الذي تم تناوله في Angrist (1990) : ما هو تأثير الخدمة العسكرية على الأرباح؟ في هذه الحالة ، يمكننا تحديد الوحدات لتكون أشخاصًا مؤهلين لمشروع عام 1970 في الولايات المتحدة ، ويمكننا فهرسة هؤلاء الأشخاص من خلال \(i = 1, \ldots, N\) . يمكن أن تكون العلاجات في هذه الحالة "خدمة في الجيش" أو "لا تخدم في الجيش". \(W_i = 1\) إذا كان الشخص \(i\) في حالة المعالجة و \(W_i = 0\) إذا كان الشخص \(i\) في حالة التحكم. وأخيراً ، فإن النتائج المحتملة تكون أكثر صعوبة من الناحية النظرية لأنها تنطوي على نتائج "محتملة" ؛ الأشياء التي يمكن أن تحدث. بالنسبة لكل شخص مؤهل لمشروع 1970 ، يمكننا تخيل المبلغ الذي كان سيحصل عليه في عام 1978 إذا كان قد خدم في الجيش ، والذي \(Y_i(1)\) ، والمبلغ الذي كانوا \(Y_i(1)\) في 1978 إذا لم يخدموا في الجيش ، الذي \(Y_i(0)\) . في إطار النتائج المحتملة ، تعتبر \(Y_i(1)\) و \(Y_i(0)\) كميات ثابتة ، في حين أن \(W_i\) هو متغير عشوائي.
إن اختيار الوحدات والعلاجات والنتائج أمر بالغ الأهمية لأنه يحدد ما يمكن - ولا يمكن - تعلمه من الدراسة. إن اختيار الوحدات - الأشخاص المؤهلون لمشروع عام 1970 - لا يشمل النساء ، ومن دون افتراضات إضافية ، لن تخبرنا هذه الدراسة بأي شيء عن تأثير الخدمة العسكرية على النساء. القرارات المتعلقة بكيفية تعريف المعالجات والنتائج مهمة أيضًا. على سبيل المثال ، هل يجب أن تركز معاملة الاهتمام على الخدمة العسكرية أو التي تعاني من القتال؟ هل يجب أن تكون حصيلة الفائدة أرباح أو رضى وظيفي؟ في نهاية المطاف ، ينبغي أن يكون الدافع وراء اختيار الوحدات والعلاجات والنتائج من قبل الأهداف العلمية والسياسة للدراسة.
بالنظر إلى خيارات الوحدات والعلاجات والنتائج المحتملة ، فإن التأثير السببي للعلاج على الشخص \(i\) ، \(\tau_i\) ، هو
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
بعبارة أخرى ، نقارن مقدار ما كسبه الشخص \(i\) بعد الخدمة إلى مقدار ما قد يكسبه الشخص \(i\) بدون الخدمة. بالنسبة لي ، مكافئ. 2.1 هي أوضح طريقة لتحديد تأثير سببي ، وعلى الرغم من بساطة هذا الإطار ، إلا أنه أصبح قابل للتعميم في العديد من الطرق الهامة (Imbens and Rubin 2015) للاهتمام (Imbens and Rubin 2015) .
عند استخدام إطار النتائج المحتملة ، غالباً ما أجد أنه من المفيد كتابة جدول يوضح النتائج المحتملة وتأثيرات المعالجة لجميع الوحدات (الجدول 2.5). إذا لم تكن قادرًا على تخيل جدول كهذا لدراستك ، فقد تحتاج إلى أن تكون أكثر دقة في تعريفاتك لوحداتك ومعالجاتك ونتائجك المحتملة.
شخص | أرباح في حالة العلاج | أرباح في حالة السيطرة | تأثير العلاج |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
تعني | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
عند تعريف التأثير السببي بهذه الطريقة ، فإننا نواجه مشكلة. في جميع الحالات تقريبًا ، لا نحترم كلا النتيجتين المحتملتين. وهذا يعني أن شخصًا معينًا خدم أو لم يخدم. لذلك ، نلاحظ واحدة من النتائج المحتملة - \(Y_i(1)\) أو \(Y_i(0)\) ولكن ليس كلاهما. إن عدم القدرة على مراقبة كلتا النتيجتين المحتملتين هو مشكلة رئيسية مثل Holland (1986) وصفتها بأنها المشكلة الأساسية للاستدلال السببي .
لحسن الحظ ، عندما نقوم بالبحث ، ليس لدينا شخص واحد فقط ؛ بدلا من ذلك ، لدينا الكثير من الناس ، وهذا يوفر وسيلة حول المشكلة الأساسية للاستدلال السببي. بدلاً من محاولة تقدير تأثير المعالجة على المستوى الفردي ، يمكننا تقدير متوسط تأثير المعالجة لكل الوحدات:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
لا يزال يتم التعبير عن هذه المعادلة من حيث \(\tau_i\) ، والتي لا يمكن \(\tau_i\) ، ولكن مع بعض الجبر (eq 2.8 of Gerber and Green (2012) ) ، نحصل على
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
وهذا يدل على أنه إذا تمكنا من تقدير متوسط \(N^{-1} \sum_{i=1}^N Y_i(1)\) السكاني تحت المعالجة ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) \(N^{-1} \sum_{i=1}^N Y_i(1)\) السكاني تحت السيطرة ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ، يمكننا حينئذ تقدير متوسط تأثير المعالجة ، حتى بدون تقدير تأثير المعالجة لأي شخص معين.
الآن بعد أن حددت تقديرنا - الشيء الذي نحاول تقديره - سأنتقل إلى كيفية تقديره الفعلي للبيانات. وهنا نتعرض مباشرة للمشكلة التي نلاحظها فقط واحدة من النتائج المحتملة لكل شخص. نرى إما \(Y_i(0)\) أو \(Y_i(1)\) (الجدول 2.6). يمكننا تقدير متوسط تأثير العلاج من خلال مقارنة أرباح الأشخاص الذين خدموا في أرباح الأشخاص الذين لم يخدموا:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
حيث \(N_t\) و \(N_c\) هي أعداد الأشخاص في ظروف العلاج والسيطرة. سوف يعمل هذا النهج بشكل جيد إذا كان تخصيص العلاج مستقلاً عن النتائج المحتملة ، وهي حالة تسمى أحيانًا الجهل . لسوء الحظ ، في غياب تجربة ، لا يتم في كثير من الأحيان تلبية الجاهلية ، مما يعني أن المقدر في eq. 2.4 ليس من المرجح أن تنتج تقديرات جيدة. طريقة واحدة للتفكير في الأمر هي أنه في غياب التنازل العشوائي للعلاج ، مكافئ. 2.4 لا يقارن مع مثل ؛ إنها تقارن أرباح أنواع مختلفة من الناس. أو عبرت عن اختلاف طفيف ، بدون تخصيص عشوائي للمعالجة ، من المحتمل أن يكون توزيع العلاج مرتبطًا بالنتائج المحتملة.
في الفصل الرابع ، سوف أصف كيف يمكن للتجارب المعشاة ذات الشواهد أن تساعد الباحثين على وضع تقديرات سببية ، وهنا سأصف كيف يمكن للباحثين الاستفادة من التجارب الطبيعية ، مثل مشروع القرعة.
شخص | أرباح في حالة العلاج | أرباح في حالة السيطرة | تأثير العلاج |
---|---|---|---|
1 | ؟ | \(Y_1(0)\) | ؟ |
2 | \(Y_2(1)\) | ؟ | ؟ |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ؟ | ؟ |
تعني | ؟ | ؟ | ؟ |
تجارب طبيعية
يتمثل أحد الأساليب في إجراء تقديرات سببية دون إجراء تجربة في البحث عن شيء ما يحدث في العالم والذي خصص لك علاجًا عشوائيًا. هذا النهج يسمى التجارب الطبيعية . في كثير من الحالات ، للأسف ، لا تقدم الطبيعة بشكل عشوائي العلاج الذي تريده للسكان المهتمين. لكن في بعض الأحيان ، تقدم الطبيعة بشكل عشوائي معالجة ذات صلة. على وجه الخصوص ، سوف أعتبر الحالة التي يوجد فيها بعض العلاج الثانوي الذي يشجع الناس على تلقي العلاج الأساسي . على سبيل المثال ، يمكن اعتبار المسودة معاملة ثانوية تم تعيينها عشوائياً والتي شجعت بعض الأشخاص على تلقي العلاج الأساسي ، الذي كان يخدم في الجيش. يسمى هذا التصميم أحيانًا بتصميم التشجيع . وأسلوب التحليل الذي سأصفه للتعامل مع هذا الموقف يسمى أحيانًا المتغيرات الآلية . في هذا الإطار ، مع بعض الافتراضات ، يمكن للباحثين استخدام التشجيع للتعرف على تأثير المعالجة الأولية لمجموعة فرعية معينة من الوحدات.
من أجل التعامل مع العلاجين المختلفين - التشجيع والمعالجة الأولية - نحتاج إلى بعض الترميز الجديد. لنفترض أن بعض الأشخاص قد تم صياغتهم بشكل عشوائي ( \(Z_i = 1\) ) أو لم يتم صياغتها ( \(Z_i = 0\) )؛ في هذه الحالة ، \(Z_i\) أحياناً أداة .
من بين أولئك الذين تم صياغتهم ، خدم البعض ( \(Z_i = 1, W_i = 1\) ) والبعض الآخر لم ( \(Z_i = 1, W_i = 0\) ). وبالمثل ، من بين أولئك الذين لم يتم صياغتهم ، خدم البعض ( \(Z_i = 0, W_i = 1\) ) والبعض الآخر لم ( \(Z_i = 0, W_i = 0\) ). يمكن الآن توسيع النتائج المحتملة لكل شخص لإظهار وضعه لكل من التشجيع والعلاج. على سبيل المثال ، let \(Y(1, W_i(1))\) هو حساب الشخص \(i\) إذا تمت صياغته ، حيث \(W_i(1)\) هي حالة الخدمة الخاصة به إذا تمت صياغتها. علاوة على ذلك ، يمكننا تقسيم السكان إلى أربع مجموعات: المجموعات المتقاربة ، والمتقدمون ، والمتقاعدين ، والمتقدمون دائمًا (الجدول 2.7).
اكتب | الخدمة في حالة صياغتها | الخدمة إذا لم تصاغ |
---|---|---|
المطيعون | نعم ، \(W_i(Z_i=1) = 1\) | لا ، \(W_i(Z_i=0) = 0\) |
أبدا محتجزي | لا ، \(W_i(Z_i=1) = 0\) | لا ، \(W_i(Z_i=0) = 0\) |
Defiers | لا ، \(W_i(Z_i=1) = 0\) | نعم ، \(W_i(Z_i=0) = 1\) |
دائما محتجزي | نعم ، \(W_i(Z_i=1) = 1\) | نعم ، \(W_i(Z_i=0) = 1\) |
قبل أن نناقش تقدير تأثير العلاج (أي الخدمة العسكرية) ، يمكننا أولاً تحديد اثنين من آثار التشجيع (أي ، يتم صياغتها). أولاً ، يمكننا تحديد تأثير التشجيع على المعالجة الأولية. ثانيا ، يمكننا تحديد تأثير التشجيع على النتيجة. سيتبين أنه يمكن الجمع بين هذين التأثيرين لتقديم تقدير لتأثير العلاج على مجموعة معينة من الناس.
أولا ، يمكن تعريف تأثير التشجيع على العلاج للشخص \(i\)
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
علاوة على ذلك ، يمكن تحديد هذه الكمية على السكان ككل
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
أخيرًا ، يمكننا تقدير \(\text{ITT} _{W}\) باستخدام البيانات:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
حيث \(\bar{W}^{\text{obs}}_1\) هو المعدل المرصود للعلاج لأولئك الذين تم تشجيعهم و \(\bar{W}^{\text{obs}}_0\) هو المعدل الملاحظ للعلاج لأولئك الذين لم يتم تشجيعهم. \(\text{ITT}_W\) يطلق عليه أحيانًا معدل الامتصاص .
بعد ذلك ، يمكن تعريف تأثير التشجيع على النتيجة على الشخص \(i\) النحو التالي:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
علاوة على ذلك ، يمكن تحديد هذه الكمية على السكان ككل
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
أخيرًا ، يمكننا تقدير \(\text{ITT}_{Y}\) باستخدام البيانات:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
حيث \(\bar{Y}^{\text{obs}}_1\) هي النتيجة المرصودة (على سبيل المثال ، الأرباح) لأولئك الذين تم تشجيعهم (على سبيل المثال ، تم صياغتها) و \(\bar{W}^{\text{obs}}_0\) هي النتيجة المرصودة لأولئك الذين لم يتم تشجيعهم.
وأخيرًا ، نوجه اهتمامنا إلى تأثير الاهتمام: تأثير المعالجة الأولية (مثل الخدمة العسكرية) على النتيجة (على سبيل المثال ، الأرباح). لسوء الحظ ، اتضح أن المرء لا يستطيع ، بشكل عام ، تقدير هذا التأثير على جميع الوحدات. ومع ذلك ، مع بعض الافتراضات ، يمكن للباحثين تقدير تأثير العلاج على المتطوعين (أي الأشخاص الذين سيخدمون إذا تمت صياغتهم والأشخاص الذين لن يخدموا إذا لم يتم صياغتهم ، الجدول 2.7). سأسمي هذا التقدير والأثر السببي للمتوسط المطلق (CACE) (والذي يسمى أيضًا أحيانًا متوسط تأثير العلاج المحلي ، LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
حيث تتبرع \(G_i\) بمجموعة الشخص \(i\) (انظر الجدول 2.7) و \(N_{\text{co}}\) هو عدد المعادلات. وبعبارة أخرى ، مكافئ. يقارن 2.11 أرباح compliers الذين تم تجنيدهم \(Y_i(1, W_i(1))\) و not \(Y_i(0, W_i(0))\) . والتقدير في مكافئ. يبدو من الصعب تقدير قيمة 2.11 من البيانات المرصودة لأنه من غير الممكن تحديد المعامِلات باستخدام البيانات المرصودة فقط (لمعرفة ما إذا كان شخص ما أكثر توافقاً ، فإنك ستحتاج إلى مراقبة ما إذا كان قد خدم عند صياغته وما إذا كان قد خدم عند عدم صياغته).
وقد اتضح - بشكل مثير للدهشة - أنه إذا كان هناك أي مقاييس ، فحينما يتم تقديم واحد يقدم ثلاث افتراضات إضافية ، من الممكن تقدير CACE من البيانات المرصودة. أولاً ، على المرء أن يفترض أن التخصيص للمعالجة عشوائي. في حالة مشروع اليانصيب هذا معقول. ومع ذلك ، في بعض الأماكن التي لا تعتمد فيها التجارب الطبيعية على التوزيع العشوائي المادي ، قد يكون هذا الافتراض أكثر إشكالية. ثانياً ، على المرء أن يفترض أنه ليس لهما أي دعاة (وهذا الافتراض يسمى أحياناً افتراض الرتابة الأحادي). في سياق المشروع يبدو من المعقول أن نفترض أن هناك عدد قليل جدا من الناس الذين لن يخدموا إذا تمت صياغتهم وسوف يعملون إذا لم يتم صياغتها. ثالثًا ، وأخيرًا ، يأتي الافتراض الأكثر أهمية والذي يسمى تقييد الاستثناء . وبموجب قيود الاستبعاد ، يتعين على المرء أن يفترض أن كل تأثير مهمة المعالجة يتم تمريره من خلال العلاج نفسه. بمعنى آخر ، يجب على المرء أن يفترض أنه لا يوجد تأثير مباشر للتشجيع على النتائج. في حالة مشروع اليانصيب ، على سبيل المثال ، يجب على المرء أن يفترض أن مشروع الحالة ليس له تأثير على الأرباح بخلاف الخدمة العسكرية (الشكل 2-11). يمكن انتهاك تقييد الاستثناء إذا ، على سبيل المثال ، قضى الأشخاص الذين تمت صياغتهم المزيد من الوقت في المدرسة لتجنب الخدمة أو إذا كان أصحاب العمل أقل عرضة لتوظيف الأشخاص الذين تمت صياغتهم.
إذا تم استيفاء هذه الشروط الثلاثة (التخصيص العشوائي للعلاج ، وعدم وجود أي من المتدخلين ، وقيود الاستبعاد) ، فيجب أن يتم ذلك
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
حتى نتمكن من تقدير CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
طريقة واحدة للتفكير في CACE هو أنه الفرق في النتائج بين أولئك الذين تم تشجيعهم وتلك التي لم يتم تشجيعهم ، والتي تضخمت من قبل معدل امتصاص.
هناك نوعان من التحذيرات الهامة التي يجب مراعاتها. أولاً ، يمثل تقييد الاستبعاد فرضاً قوياً ، ويجب تبريره على أساس كل حالة على حدة ، الأمر الذي يتطلب في كثير من الأحيان خبرة في مجال الموضوع. لا يمكن تبرير تقييد الاستبعاد مع التوزيع العشوائي للتشجيع. ثانياً ، يكمن التحدي العملي المشترك مع التحليل المتغير ذو الأدوات عندما يكون للتشجيع تأثير بسيط على امتصاص العلاج (عندما يكون \(\text{ITT}_W\) صغيرًا). وهذا ما يسمى أداة ضعيفة ، ويؤدي إلى مجموعة متنوعة من المشاكل (Imbens and Rosenbaum 2005; Murray 2006) . إحدى الطرق للتفكير في المشكلة مع الأدوات الضعيفة هي أن \(\widehat{\text{CACE}}\) قد تكون حساسة للتحيزات الصغيرة في \(\widehat{\text{ITT}_Y}\) محتمل بسبب انتهاكات قيود الاستبعاد - لأن هذه التحيزات تتضخم بواسطة \(\widehat{\text{ITT}_W}\) (انظر المعادلة 2.13). على وجه التقريب ، إذا كان العلاج الذي تعينه الطبيعة ليس له تأثير كبير على العلاج الذي تهتم به ، فعندئذ سوف تواجه صعوبة في التعرف على العلاج الذي يهمك.
انظر الفصل 23 و 24 من Imbens and Rubin (2015) للحصول على نسخة أكثر رسمية من هذا النقاش. عادة ما يتم التعبير عن المقاربة الاقتصادية التقليدية للمتغيرات الآلية من حيث تقدير المعادلات وليس النتائج المحتملة. للاطلاع على مقدمة من هذا المنظور الآخر ، انظر Angrist and Pischke (2009) ، وللمقارنة بين المقاربتين ، انظر القسم 24.6 من Imbens and Rubin (2015) . ويرد في الفصل 6 من Gerber and Green (2012) عرض بديل أقل رسميًا لنهج المتغيرات الآلية. لمعرفة المزيد حول قيود الاستثناء ، انظر D. Jones (2015) . Aronow and Carnegie (2013) مجموعة إضافية من الافتراضات التي يمكن استخدامها لتقدير ATE بدلاً من CACE. لمزيد من المعلومات حول الكيفية التي يمكن بها للتجارب الطبيعية أن تكون Sekhon and Titiunik (2012) للغاية في تفسيرها ، انظر Sekhon and Titiunik (2012) . للحصول على مقدمة أكثر عمومية للتجارب الطبيعية - التي تتجاوز مجرد نهج المتغيرات المفيدة ، فإنها تشمل أيضًا تصاميم مثل انحدار الانحدار - انظر Dunning (2012) .