บันทึกทางคณิตศาสตร์

ในภาคผนวกนี้ฉันจะสรุปความคิดบางอย่างเกี่ยวกับการอนุมานสาเหตุจากข้อมูลที่ไม่ได้ทดลองในรูปแบบทางคณิตศาสตร์เล็กน้อย มีสองแนวทางหลักคือกรอบแนวคิดเกี่ยวกับสาเหตุส่วนใหญ่เกี่ยวข้องกับ Judea Pearl และเพื่อนร่วมงานและกรอบผลลัพธ์ที่เป็นไปได้ซึ่งเกี่ยวข้องกับโดนัลด์รูบินและเพื่อนร่วมงานมากที่สุด ฉันจะแนะนำกรอบผลลัพธ์ที่เป็นไปได้เนื่องจากมีการเชื่อมโยงอย่างใกล้ชิดกับแนวคิดในบันทึกทางคณิตศาสตร์ในตอนท้ายของบทที่ 3 และ 4 สำหรับข้อมูลเพิ่มเติมเกี่ยวกับกรอบแนวคิดสาเหตุฉันขอแนะนำ Pearl, Glymour, and Jewell (2016) (เบื้องต้น ) และ Pearl (2009) (ขั้นสูง) สำหรับการรักษาความยาวของหนังสือที่เกี่ยวกับการอนุมานเชิงสาเหตุที่รวมเอากรอบผลลัพธ์ที่เป็นไปได้และกรอบกราฟสาเหตุผมขอแนะนำ Morgan and Winship (2014)

เป้าหมายของภาคผนวกนี้คือการช่วยให้คุณทำความคุ้นเคยกับสัญกรณ์และรูปแบบของผลสืบเนื่องที่อาจเป็นไปได้เพื่อที่คุณจะสามารถเปลี่ยนไปใช้เนื้อหาทางเทคนิคที่เขียนขึ้นในหัวข้อนี้ได้ อันดับแรกฉันจะอธิบายกรอบผลลัพธ์ที่เป็นไปได้ จากนั้นฉันจะใช้เพื่อหารือเกี่ยวกับการทดลองตามธรรมชาติเช่นเดียวกับ Angrist (1990) เกี่ยวกับผลกระทบของการรับราชการทหารกับรายได้ ส่วนภาคผนวกนี้นำมาใช้อย่างมากกับ Imbens and Rubin (2015)

กรอบผลลัพธ์ที่เป็นไปได้

กรอบผลลัพธ์ที่เป็นไปได้มีสามองค์ประกอบหลัก ได้แก่ หน่วย การรักษา และ ผลลัพธ์ที่อาจเกิดขึ้น เพื่อที่จะแสดงให้เห็นถึงองค์ประกอบเหล่านี้ลองพิจารณารูปแบบเก๋ ๆ ของคำถามที่ระบุไว้ใน Angrist (1990) : อะไรคือผลกระทบของการรับราชการทหารต่อรายได้? ในกรณีนี้เราสามารถกำหนด หน่วย ให้เป็นบุคคลที่มีสิทธิ์ได้รับร่างรัฐธรรมนูญปีพ. ศ. 2513 ในสหรัฐอเมริกาและเราสามารถจัดทำดัชนีคนเหล่านี้ได้โดย \(i = 1, \ldots, N\) การ รักษา ในกรณีนี้อาจเป็น "การรับราชการทหาร" หรือ "ไม่ทำหน้าที่ในการทหาร" ฉันจะเรียกสิ่งเหล่านี้ว่าเงื่อนไขการรักษาและการควบคุมและฉันจะเขียน \(W_i = 1\) ถ้าบุคคลนั้น \(i\) อยู่ในสภาพบำบัดและ \(W_i = 0\) ถ้าบุคคล \(i\) อยู่ในสภาวะการควบคุม ในที่สุด ผลที่อาจเกิดขึ้น มีความยากมากขึ้นเกี่ยวกับแนวคิดเนื่องจากเกี่ยวข้องกับผลลัพธ์ "ศักยภาพ" สิ่งที่อาจเกิดขึ้น สำหรับแต่ละคนที่มีสิทธิ์ได้รับร่างพ. ศ. 2513 เราสามารถจินตนาการจำนวนเงินที่จะได้รับในปี 2521 หากทำหน้าที่เป็นทหารซึ่งผมจะเรียกว่า \(Y_i(1)\) และจำนวนเงินที่พวกเขาจะได้รับ 1978 ถ้าพวกเขาไม่ได้ทำหน้าที่ในการทหารซึ่งฉันจะเรียก \(Y_i(0)\) ในกรอบผลลัพธ์ที่เป็นไปได้ \(Y_i(1)\) และ \(Y_i(0)\) ถือว่าเป็นปริมาณคงที่ในขณะที่ \(W_i\) เป็นตัวแปรสุ่ม

การเลือกหน่วยการรักษาและผลลัพธ์เป็นสิ่งสำคัญเนื่องจากกำหนดสิ่งที่สามารถและไม่สามารถเรียนรู้ได้จากการศึกษา ทางเลือกของหน่วยงานที่มีสิทธิ์สำหรับร่าง 1970 ไม่รวมผู้หญิงและอื่น ๆ โดยไม่มีข้อสันนิษฐานเพิ่มเติมการศึกษานี้จะไม่บอกเราเกี่ยวกับผลกระทบของการรับราชการทหารต่อสตรี การตัดสินใจเกี่ยวกับวิธีการกำหนดวิธีการรักษาและผลลัพธ์เป็นสิ่งสำคัญเช่นเดียวกัน ตัวอย่างเช่นการรักษาความสนใจควรมุ่งเน้นไปที่การให้บริการในการรบทางทหารหรือประสบปัญหาหรือไม่? ผลที่น่าสนใจควรเป็นรายได้หรือความพึงพอใจในงาน? ในท้ายที่สุดการเลือกหน่วยการรักษาและผลลัพธ์ควรได้รับการขับเคลื่อนโดยเป้าหมายทางวิทยาศาสตร์และนโยบายของการศึกษา

เมื่อพิจารณาถึงทางเลือกของหน่วยการรักษาและผลลัพธ์ที่อาจเกิดขึ้นผลกระทบเชิงสาเหตุของการรักษากับคน \(i\) , \(\tau_i\) คือ

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]

ในคำอื่น ๆ เราเปรียบเทียบคนเท่าใด \(i\) จะได้รับหลังจากที่ให้บริการเท่าใดคน \(i\) จะมีรายได้โดยไม่ต้องให้บริการ ให้ฉัน eq. 2.1 เป็นวิธีการที่ชัดเจนที่สุดในการกำหนดผลกระทบเชิงสาเหตุและถึงแม้ว่าจะง่ายมากก็ตามกรอบนี้จะแสดงออกในหลายรูปแบบที่น่าสนใจและน่าสนใจ (Imbens and Rubin 2015)

เมื่อใช้กรอบผลลัพธ์ที่เป็นไปได้ฉันมักพบว่าเป็นประโยชน์ในการเขียนตารางแสดงผลลัพธ์ที่เป็นไปได้และผลการรักษาสำหรับทุกหน่วย (ตาราง 2.5) หากคุณไม่สามารถจินตนาการโต๊ะแบบนี้เพื่อการศึกษาของคุณได้คุณอาจจำเป็นต้องระบุคำจำกัดความของหน่วยการรักษาและผลลัพธ์ที่อาจเกิดขึ้นได้ชัดเจนยิ่งขึ้น

ตารางที่ 2.5: ตารางแสดงผลที่อาจเกิดขึ้น
คน กำไรในสภาพการรักษา รายได้อยู่ในสภาพควบคุม ผลการรักษา
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
หมายความ \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

เมื่อกำหนดผลกระทบเชิงสาเหตุด้วยวิธีนี้เราจะประสบปัญหา ในเกือบทุกกรณีเราไม่ได้สังเกตเห็นผลที่อาจเกิดขึ้นทั้งสอง นั่นคือบุคคลใดบุคคลหนึ่งให้บริการหรือไม่ได้ให้บริการ ดังนั้นเราจึงสังเกตเห็นหนึ่งในผลที่อาจเกิดขึ้น - \(Y_i(1)\) หรือ \(Y_i(0)\) ไม่ใช่ทั้งสองอย่าง ไม่สามารถที่จะสังเกตเห็นผลลัพธ์ที่เป็นไปได้ทั้งสองอย่างนี้เป็นปัญหาสำคัญที่ Holland (1986) เรียกว่า ปัญหาพื้นฐานของการอนุมานสาเหตุ

โชคดีที่เมื่อเรากำลังทำวิจัยเราไม่ได้มีแค่หนึ่งคนเท่านั้น แต่เรามีคนจำนวนมากและนี่เป็นวิธีการแก้ปัญหาพื้นฐานของการอนุมานสาเหตุ แทนที่จะพยายามประมาณผลการรักษาแต่ละระดับเราสามารถประมาณ ผลการรักษาโดยเฉลี่ย สำหรับทุกหน่วย:

\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]

สมการนี้ยังคงแสดงออกมาในรูปของ \(\tau_i\) ซึ่งไม่สามารถสังเกตได้ แต่ด้วยพีชคณิต (eq 2.8 ของ Gerber and Green (2012) ) เราได้

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]

นี้แสดงให้เห็นว่าถ้าเราสามารถประมาณการประชากรผลเฉลี่ยอยู่ภายใต้การรักษา ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) และประชากรผลเฉลี่ยภายใต้การควบคุม ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) จากนั้นเราสามารถประมาณผลการรักษาโดยเฉลี่ยได้โดยไม่ต้องประมาณผลการรักษาสำหรับบุคคลใดบุคคลหนึ่ง

ตอนนี้ฉันได้กำหนดค่าประมาณของเราแล้ว - สิ่งที่เรากำลังพยายามประเมิน - ฉันจะหันไปหาวิธีที่เราสามารถประมาณค่าได้ด้วยข้อมูล และที่นี่เราทำงานโดยตรงกับปัญหาที่เราสังเกตเฉพาะผลลัพธ์ที่อาจเป็นไปได้สำหรับแต่ละคน เราจะเห็น \(Y_i(0)\) หรือ \(Y_i(1)\) (ตารางที่ 2.6) เราสามารถประมาณผลการรักษาโดยเฉลี่ยได้โดยการเปรียบเทียบรายได้ของคนที่ทำกำไรกับคนที่ไม่ได้ให้บริการ:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]

ที่ \(N_t\) และ \(N_c\) คือจำนวนคนในเงื่อนไขการรักษาและการควบคุม วิธีนี้จะทำงานได้ดีถ้าการ กำหนดการ รักษาเป็นอิสระจากผลลัพธ์ที่อาจเกิดขึ้นเงื่อนไขที่บางครั้งเรียกว่า ignorability แต่น่าเสียดายที่ในกรณีที่ไม่มีการทดลองความไม่รู้ไม่ค่อยพอใจซึ่งหมายความว่าตัวประมาณในสมการ 2.4 ไม่น่าจะมีการคาดการณ์ที่ดี วิธีหนึ่งที่จะคิดเกี่ยวกับเรื่องนี้คือในกรณีที่ไม่มีการกำหนดแบบสุ่มของการรักษา eq. 2.4 ไม่ได้เปรียบเทียบกับชอบ; มันคือการเปรียบเทียบรายได้ของคนประเภทต่างๆ หรือแสดงออกแตกต่างกันเล็กน้อยโดยไม่ได้รับมอบหมายแบบสุ่มในการรักษาการจัดสรรการรักษาอาจเกี่ยวข้องกับผลลัพธ์ที่อาจเกิดขึ้น

ในบทที่ 4 ฉันจะอธิบายว่าการทดลองที่มีการควบคุมแบบสุ่มช่วยให้นักวิจัยสามารถประมาณค่าเชิงสาเหตุและที่นี่ฉันจะอธิบายวิธีที่นักวิจัยสามารถใช้ประโยชน์จากการทดลองตามธรรมชาติเช่นการจับสลากร่าง

ตารางที่ 2.6: ตารางผลการสังเกต
คน กำไรในสภาพการรักษา รายได้อยู่ในสภาพควบคุม ผลการรักษา
1 ? \(Y_1(0)\) ?
2 \(Y_2(1)\) ? ?
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(N\) \(Y_N(1)\) ? ?
หมายความ ? ? ?

การทดลองตามธรรมชาติ

วิธีการหนึ่งในการประเมินสาเหตุโดยไม่ต้องใช้การทดสอบคือการมองหาบางสิ่งที่เกิดขึ้นในโลกที่ได้รับมอบหมายให้ทำแบบสุ่มสำหรับคุณ วิธีนี้เรียกว่า การทดลองตามธรรมชาติ ในหลาย ๆ สถานการณ์โชคไม่ดีธรรมชาติไม่สุ่มให้การรักษาที่คุณต้องการให้ประชากรที่น่าสนใจ แต่บางครั้งธรรมชาติจะสุ่มให้การรักษาที่เกี่ยวข้อง โดยเฉพาะอย่างยิ่งฉันจะพิจารณากรณีที่มี การรักษาทุติยภูมิ ที่กระตุ้นให้คนได้รับการ รักษาหลัก ตัวอย่างเช่นร่างอาจได้รับการพิจารณาการรักษาที่ได้รับมอบหมายแบบสุ่มที่ได้รับการสุ่มตัวอย่างซึ่งสนับสนุนให้บางคนได้รับการรักษาหลักซึ่งทำหน้าที่ในการทหาร การออกแบบนี้บางครั้งเรียกว่าการ ออกแบบการให้กำลังใจ และวิธีการวิเคราะห์ที่ฉันจะอธิบายเพื่อจัดการกับสถานการณ์นี้บางครั้งเรียกว่า ตัวแปรของเครื่องมือ ในการตั้งค่านี้มีข้อสันนิษฐานบางอย่างนักวิจัยสามารถใช้การให้กำลังใจเพื่อเรียนรู้เกี่ยวกับผลกระทบของการบำบัดรักษาเบื้องต้นของเซตย่อยเฉพาะ

เพื่อที่จะจัดการกับสองวิธีการรักษาที่แตกต่างกันนั่นคือการให้กำลังใจและการรักษาหลักเราจำเป็นต้องมีสัญกรณ์ใหม่ สมมุติว่ามีคนร่างแบบสุ่ม ( \(Z_i = 1\) ) หรือไม่ร่าง ( \(Z_i = 0\) ); ในสถานการณ์เช่นนี้ \(Z_i\) บางครั้งเรียกว่า เครื่องมือ

ในบรรดาคนที่ถูกเกณฑ์ทหารบางคนทำหน้าที่ ( \(Z_i = 1, W_i = 1\) ) และบางคนก็ไม่ได้ ( \(Z_i = 1, W_i = 0\) ) ในทำนองเดียวกันในหมู่ผู้ที่ไม่ได้ร่างบางคนทำหน้าที่ ( \(Z_i = 0, W_i = 1\) ) และบางคนก็ไม่ได้ ( \(Z_i = 0, W_i = 0\) ) ผลลัพธ์ที่เป็นไปได้สำหรับแต่ละคนสามารถขยายเพื่อแสดงสถานะของพวกเขาทั้งในการให้กำลังใจและการรักษา ยกตัวอย่างเช่นให้ \(Y(1, W_i(1))\) เป็นรายได้ของบุคคล \(i\) ถ้าเขาถูกเกณฑ์ทหารโดยที่ \(W_i(1)\) เป็นสถานะการให้บริการของเขาถ้าร่างขึ้น นอกจากนี้เราสามารถแบ่งประชากรออกเป็น 4 กลุ่มคือกลุ่มผู้มีส่วนได้ส่วนเสียคนที่ไม่เคยเสียสติและคนที่มีใจเสมอ (ตาราง 2.7)

ตารางที่ 2.7: สี่ประเภทของคน
ชนิด บริการถ้าร่าง บริการหากไม่ได้จัดทำเป็นร่าง
compliers ใช่ \(W_i(Z_i=1) = 1\) ไม่ \(W_i(Z_i=0) = 0\)
ไม่เคยผู้รับ ไม่ \(W_i(Z_i=1) = 0\) ไม่ \(W_i(Z_i=0) = 0\)
Defiers ไม่ \(W_i(Z_i=1) = 0\) ใช่ \(W_i(Z_i=0) = 1\)
ผู้รับเสมอ ใช่ \(W_i(Z_i=1) = 1\) ใช่ \(W_i(Z_i=0) = 1\)

ก่อนที่เราจะหารือเกี่ยวกับการประเมินผลของการรักษา (เช่นการรับราชการทหาร) เราสามารถนิยามผลกระทบจากการให้กำลังใจทั้งสองแบบ (เช่นการร่าง) ประการแรกเราสามารถกำหนดผลของการให้กำลังใจในการรักษาเบื้องต้น สองเราสามารถกำหนดผลของการให้กำลังใจกับผล จะมีการเปิดเผยว่าผลกระทบทั้งสองนี้สามารถนำมารวมกันเพื่อประเมินผลกระทบของการรักษาต่อคนกลุ่มใดกลุ่มหนึ่งได้

ประการแรกผลของการให้กำลังใจในการรักษาสามารถกำหนดสำหรับบุคคล \(i\) as

\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]

นอกจากนี้ปริมาณนี้สามารถกำหนดได้มากกว่าประชากรทั้งหมดเป็น

\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]

สุดท้ายเราสามารถประมาณ \(\text{ITT} _{W}\) โดยใช้ข้อมูล:

\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]

โดยที่ \(\bar{W}^{\text{obs}}_1\) เป็นอัตราการรักษาที่สังเกตได้สำหรับผู้ที่ได้รับการสนับสนุนและ \(\bar{W}^{\text{obs}}_0\) คือ อัตราการรักษาที่สังเกตได้สำหรับผู้ที่ไม่ได้รับการส่งเสริม \(\text{ITT}_W\) บางครั้งก็เรียกว่า อัตราการดูดซึม

ถัดไปผลของการให้กำลังใจกับผลลัพธ์ที่สามารถกำหนดสำหรับบุคคล \(i\) เป็น:

\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]

นอกจากนี้ปริมาณนี้สามารถกำหนดได้มากกว่าประชากรทั้งหมดเป็น

\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]

สุดท้ายเราสามารถประมาณ \(\text{ITT}_{Y}\) โดยใช้ข้อมูล:

\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]

ที่ \(\bar{Y}^{\text{obs}}_1\) เป็นผลลัพธ์ที่สังเกตได้ (เช่นรายได้) สำหรับผู้ที่ได้รับการสนับสนุน (เช่นร่าง) และ \(\bar{W}^{\text{obs}}_0\) เป็นผลลัพธ์ที่สังเกตได้สำหรับผู้ที่ไม่ได้รับการสนับสนุน

สุดท้ายเราหันไปสนใจผลกระทบ: ผลของการรักษาเบื้องต้น (เช่นการรับราชการทหาร) ต่อผล (เช่นรายได้) แต่น่าเสียดายที่ปรากฎว่าเราไม่สามารถประเมินผลกระทบนี้ได้จากทุกหน่วยงาน อย่างไรก็ตามนักวิจัยสามารถคาดการณ์ผลกระทบของการรักษาต่อผู้ทรงคุณวุฒิ (เช่นคนที่จะให้บริการถ้าร่างและผู้ที่ไม่ยอมทำหน้าที่ถ้าไม่ได้ร่างขึ้นตารางที่ 2.7) ฉันจะเรียกค่าประมาณนี้และค่าคอมมิชชั่น เฉลี่ย (CACE) (ซึ่งบางครั้งเรียกว่า ผลการรักษาโดยเฉลี่ยในท้องถิ่น LATE):

\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]

โดยที่ \(G_i\) บริจาคกลุ่มบุคคล \(i\) (ดูตารางที่ 2.7) และ \(N_{\text{co}}\) คือจำนวนผู้คอมไพล์ กล่าวอีกนัยหนึ่ง eq. 2.11 เปรียบเทียบรายได้ของผู้ \(Y_i(1, W_i(1))\) ที่กำลังร่าง \(Y_i(1, W_i(1))\) และไม่ได้ร่าง \(Y_i(0, W_i(0))\) ค่าประมาณใน eq. 2.11 ดูเหมือนจะยากที่จะประเมินจากข้อมูลที่สังเกตได้เนื่องจากไม่สามารถระบุตัวบ่งชี้ได้โดยใช้ข้อมูลที่สังเกตได้เท่านั้น (หากต้องการทราบว่าใครเป็นคอมไพเลอร์คุณจะต้องสังเกตดูว่าเขาทำหน้าที่เมื่อร่างและไม่ว่าจะทำหน้าที่เมื่อไม่ได้ร่างหรือไม่ก็ตาม)

ปรากฎว่าไม่ค่อยน่าแปลกใจคือหากมีผู้รวบรวมรายอื่น ๆ จากนั้นให้สมมติฐานสามข้อทำให้เราสามารถคาดการณ์ CACE จากข้อมูลที่สังเกตได้ ประการแรกต้องสมมติว่าการกำหนดให้เข้ารับการรักษาเป็นแบบสุ่ม ในกรณีของการจับสลากร่างนี้เป็นเรื่องที่สมเหตุสมผล อย่างไรก็ตามในการตั้งค่าบางอย่างที่การทดลองตามธรรมชาติไม่ได้อาศัยการสุ่มตัวอย่างทางกายภาพสมมติฐานนี้อาจเป็นปัญหาได้มากขึ้น ประการที่สองเราต้องสมมติว่าไม่มี defiers (สมมติฐานนี้บางครั้งเรียกว่าสมมติฐาน monotonicity) ในบริบทของร่างเห็นได้ชัดว่าสมมติว่ามีผู้น้อยมากที่จะไม่ให้บริการถ้าร่างและจะให้บริการถ้าไม่ได้ร่างขึ้น ประการที่สามและสุดท้ายก็มาถึงสมมติฐานที่สำคัญที่สุดซึ่งเรียกว่า ข้อ จำกัด การยกเว้น ภายใต้ข้อ จำกัด การยกเว้นเราต้องสมมติว่าผลการรักษาทั้งหมดผ่านการรักษาด้วยตัวเอง กล่าวอีกนัยหนึ่งเราต้องสมมติว่าไม่มีผลโดยตรงต่อการให้กำลังใจกับผลลัพธ์ ในกรณีของการจับสลากร่างนั้นจำเป็นต้องสมมติว่าสถานะร่างไม่มีผลต่อรายได้อื่นนอกเหนือจากการรับราชการทหาร (รูปที่ 2.11) ข้อ จำกัด ในการยกเว้นอาจถูกละเมิดหากตัวอย่างเช่นคนที่ถูกเกณฑ์ทหารใช้เวลาเรียนอยู่ในโรงเรียนมากขึ้นเพื่อหลีกเลี่ยงการให้บริการหรือถ้านายจ้างมีโอกาสน้อยที่จะจ้างคนที่ถูกเกณฑ์ทหาร

รูปที่ 2.11: ข้อ จำกัด การยกเว้นจำเป็นต้องให้การสนับสนุน (การจับสลากร่าง) มีผลต่อผลลัพธ์ (รายได้) เฉพาะในการรักษา (การรับราชการทหาร) อาจมีการละเมิดข้อยกเว้นการยกเว้นตัวอย่างเช่นผู้ที่ถูกเกณฑ์ทหารใช้เวลาเรียนอยู่ในโรงเรียนมากขึ้นเพื่อหลีกเลี่ยงการให้บริการและการเพิ่มเวลาเรียนในโรงเรียนทำให้มีรายได้สูงขึ้น

รูปที่ 2.11: ข้อ จำกัด การยกเว้นจำเป็นต้องให้การสนับสนุน (การจับสลากร่าง) มีผลต่อผลลัพธ์ (รายได้) เฉพาะในการรักษา (การรับราชการทหาร) อาจมีการละเมิดข้อยกเว้นการยกเว้นตัวอย่างเช่นผู้ที่ถูกเกณฑ์ทหารใช้เวลาเรียนอยู่ในโรงเรียนมากขึ้นเพื่อหลีกเลี่ยงการให้บริการและการเพิ่มเวลาเรียนในโรงเรียนทำให้มีรายได้สูงขึ้น

ถ้าเงื่อนไขทั้งสามนี้ (การกำหนดแบบสุ่มเพื่อการรักษาไม่มี defiers และข้อ จำกัด การยกเว้น) จะได้รับการตอบสนองแล้ว

\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]

เพื่อให้เราสามารถประมาณการ CACE:

\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]

วิธีหนึ่งที่จะนึกถึง CACE คือผลลัพธ์ที่แตกต่างกันระหว่างผู้ที่ได้รับการสนับสนุนและผู้ที่ไม่ได้รับการสนับสนุนซึ่งเพิ่มขึ้นจากอัตราการบริโภค

มีข้อควรระวังสำคัญสองประการที่ต้องคำนึงถึง ประการแรกข้อ จำกัด ในการยกเว้นเป็นข้อสมมติฐานที่แข็งแกร่งและจำเป็นต้องได้รับการพิสูจน์เป็นกรณี ๆ ไปซึ่งมักต้องใช้ความชำนาญเฉพาะเรื่อง ข้อ จำกัด การยกเว้นไม่สามารถเป็นเหตุผลได้ด้วยการสุ่มให้กำลังใจ ประการที่สองความท้าทายในทางปฏิบัติร่วมกับการวิเคราะห์ตัวแปรแบบมีประโยชน์มาจากการที่การให้กำลังใจมีผลเพียงเล็กน้อยต่อการรักษา (เมื่อ \(\text{ITT}_W\) มีขนาดเล็ก นี้เรียกว่า เครื่องมือที่อ่อนแอ และจะนำไปสู่ความหลากหลายของปัญหา (Imbens and Rosenbaum 2005; Murray 2006) วิธีหนึ่งในการคิดเกี่ยวกับปัญหาเกี่ยวกับเครื่องมือที่อ่อนแอคือ \(\widehat{\text{CACE}}\) อาจมีความสำคัญกับอคติเล็ก ๆ ใน \(\widehat{\text{ITT}_Y}\) เนื่องจาก การฝ่าฝืนข้อยกเว้นการกีดกัน - เพราะอคติเหล่านี้ได้รับการขยายโดยขนาดเล็ก \(\widehat{\text{ITT}_W}\) (ดูสม 2.13) หากการรักษาธรรมชาติที่ได้รับมอบหมายไม่ได้มีผลกระทบอย่างมากต่อการรักษาที่คุณสนใจ แต่คุณก็จะมีเวลาเรียนรู้เกี่ยวกับการรักษาที่คุณสนใจ

ดูบทที่ 23 และ 24 ของ Imbens and Rubin (2015) สำหรับการอภิปรายแบบเป็นทางการนี้ วิธีการทางเศรษฐมิติแบบดั้งเดิมกับตัวแปรของเครื่องมือมักแสดงออกมาในแง่ของการประมาณสมการไม่ใช่ผลลัพธ์ที่เป็นไปได้ สำหรับการแนะนำจากมุมมองอื่น ๆ ให้ดูที่ Angrist and Pischke (2009) และสำหรับการเปรียบเทียบระหว่างสองวิธีนี้ดูหัวข้อ 24.6 Imbens and Rubin (2015) อีกทางเลือกหนึ่งนำเสนอเล็กน้อยในรูปแบบการนำเสนอของบรรเจิดมีไว้ในบทที่ 6 ของ Gerber and Green (2012) สำหรับข้อมูลเพิ่มเติมเกี่ยวกับข้อ จำกัด การยกเว้นโปรดดู D. Jones (2015) Aronow and Carnegie (2013) อธิบายถึงข้อสันนิษฐานเพิ่มเติมที่สามารถใช้ประเมิน ATE แทน CACE สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการทดลองตามธรรมชาติอาจเป็นการยากที่จะตีความได้ดู Sekhon and Titiunik (2012) สำหรับการแนะนำทั่วไปเกี่ยวกับการทดลองตามธรรมชาติอย่างใดอย่างหนึ่งที่นอกเหนือไปจากวิธีตัวแปรแบบมีประโยชน์แล้วยังรวมถึงการออกแบบเช่นการถดถอยแบบไม่ต่อเนื่องดู Dunning (2012)