การทดลองธรรมชาติใช้ประโยชน์จากเหตุการณ์สุ่มในโลก เหตุการณ์สุ่ม + ตลอดเวลาในระบบข้อมูล = ทดลองทางธรรมชาติ
กุญแจสำคัญในการสุ่มทดลองควบคุมการเปิดใช้งานการเปรียบเทียบยุติธรรมสุ่ม แต่บางครั้งสิ่งที่เกิดขึ้นในโลกที่เป็นหลักกำหนดคนสุ่มหรือเกือบสุ่มการรักษาที่แตกต่างกัน หนึ่งในตัวอย่างที่ชัดเจนของกลยุทธ์ของการใช้การทดลองธรรมชาติที่มาจากการวิจัยของ Angrist (1990) ที่มีขนาดผลของการบริการทหารกำไร
ในช่วงสงครามเวียดนามในสหรัฐอเมริกาเพิ่มขนาดของกองกำลังติดอาวุธของตนผ่านร่าง เพื่อที่จะตัดสินใจที่ประชาชนจะได้รับการเรียกว่าเป็นบริการที่รัฐบาลสหรัฐจัดขึ้นจับสลาก ทุกวันเกิดเป็นตัวแทนบนแผ่นกระดาษและเอกสารเหล่านี้ถูกวางไว้ในขวดแก้วขนาดใหญ่ ดังแสดงในรูป 2.5 ใบนี้ของกระดาษที่ถูกดึงออกมาจากขวดหนึ่งครั้งเพื่อกำหนดลำดับที่ชายหนุ่มจะเรียกว่าการให้บริการ (หญิงสาวก็ไม่ใช่เรื่องที่จะร่าง) บนพื้นฐานของผลคนเกิดวันที่ 14 กันยายนที่ถูกเรียกว่าครั้งแรกที่คนเกิดวันที่ 24 เมษายนที่ถูกเรียกว่าสองและอื่น ๆ ในท้ายที่สุดในการจับสลากนี้คนเกิดวันที่ 195 วันที่แตกต่างถูกเรียกว่าการให้บริการในขณะที่คนเกิดวันที่ 171 วันที่ไม่ได้เรียก
แม้ว่ามันอาจจะไม่ปรากฏทันทีร่างหวยมีความคล้ายคลึงกันที่สำคัญในการทดลองควบคุมแบบสุ่ม: ในสถานการณ์ที่ทั้งสองเข้าร่วมจะสุ่มให้ได้รับการรักษา ในกรณีของร่างหวยถ้าเรามีความสนใจในการเรียนรู้เกี่ยวกับผลกระทบของร่างคุณสมบัติและการรับราชการทหารเกี่ยวกับรายได้ในตลาดแรงงานที่ตามมาเราสามารถเปรียบเทียบผลสำหรับคนที่มีวันเกิดใต้ตัดการจับสลาก (เช่น 14 กันยายน, เมษายน 24 ฯลฯ ) กับผลสำหรับคนที่มีวันคล้ายวันเกิดได้หลังจากตัด (เช่นวันที่ 20 กุมภาพันธ์ที่ 2 ธันวาคม ฯลฯ )
ระบุว่าการรักษาถูกเกณฑ์นี้ได้รับการสุ่มจากนั้นเราจะสามารถวัดผลของการรักษานี้ได้ผลใด ๆ ที่ได้รับการวัด ยกตัวอย่างเช่น Angrist (1990) รวมข้อมูลเกี่ยวกับผู้ได้รับการสุ่มเลือกในร่างกับข้อมูลรายได้ที่เก็บรวบรวมโดยสำนักงานคณะกรรมการประกันสังคมที่จะสรุปว่าผลประกอบการของทหารผ่านศึกสีขาวมีประมาณ 15% น้อยกว่ารายได้ของเทียบเคียงทหารผ่านศึกที่ไม่ใช่ที่ . นักวิจัยคนอื่นได้ใช้เคล็ดลับที่คล้ายกันเป็นอย่างดี ยกตัวอย่างเช่น Conley and Heerwig (2011) รวมข้อมูลเกี่ยวกับผู้ได้รับการสุ่มเลือกในร่างกับข้อมูลที่ใช้ในครัวเรือนที่เก็บรวบรวมจากการสำรวจ 2000 การสำรวจสำมะโนประชากร 2005 และชุมชนชาวอเมริกันและพบว่าตราบหลังจากร่างมีผลระยะยาวเล็ก ๆ น้อย ๆ รับราชการทหารอยู่กับความหลากหลายของผลเช่นการครอบครองที่อยู่อาศัย (เจ้าของเมื่อเทียบกับการให้เช่า) และความมั่นคงที่อยู่อาศัย (โอกาสของการเดินในห้าปีก่อน)
เป็นตัวอย่างนี้แสดงให้เห็นบางครั้งสังคมการเมืองหรือธรรมชาติสร้างกองกำลังทดลองหรือใกล้ทดลองที่สามารถ leveraged โดยนักวิจัย บ่อยครั้งที่การทดลองธรรมชาติเป็นวิธีที่ดีที่สุดในการประเมินความสัมพันธ์ระหว่างสาเหตุและผลกระทบในการตั้งค่าที่มันไม่จริยธรรมหรือการปฏิบัติที่จะใช้การทดสอบแบบสุ่ม พวกเขาเป็นกลยุทธ์ที่สำคัญสำหรับการค้นพบการเปรียบเทียบเป็นธรรมในข้อมูลที่ไม่ใช่การทดลอง กลยุทธ์การวิจัยครั้งนี้สามารถสรุปได้จากสมการนี้:
\ [\ {ข้อความสุ่ม (หรือถ้าสุ่ม) เหตุการณ์} + \ ข้อความ {เสมอในการสตรีมข้อมูล} = \ ข้อความ {ทดลองทางธรรมชาติ} \ qquad (2.1) \]
อย่างไรก็ตามการวิเคราะห์การทดลองธรรมชาติที่สามารถจะค่อนข้างยุ่งยาก ยกตัวอย่างเช่นในกรณีของร่างเวียดนามทุกคนไม่ได้ซึ่งเป็นร่างที่มีสิทธิ์จบลงด้วยการให้บริการ (มีความหลากหลายของการยกเว้น) และในขณะเดียวกันบางคนที่ไม่ได้ถูกร่างที่มีสิทธิ์อาสาสำหรับการให้บริการ มันเป็นเหมือนกับว่าในการทดลองทางคลินิกของยาเสพติดใหม่บางคนที่อยู่ในกลุ่มการรักษาไม่ได้ใช้ยาของพวกเขาและบางส่วนของคนที่อยู่ในกลุ่มควบคุมอย่างใดได้รับยาเสพติด ปัญหานี้เรียกว่าการไม่ปฏิบัติตามสองด้านเช่นเดียวกับปัญหาอื่น ๆ ที่อธิบายไว้ในรายละเอียดมากขึ้นในบางส่วนของการอ่านที่แนะนำในตอนท้ายของบทนี้
กลยุทธ์ของการใช้ประโยชน์จากธรรมชาติที่เกิดขึ้นได้รับมอบหมายสุ่มแจ๋วยุคดิจิตอล แต่ความชุกของข้อมูลขนาดใหญ่ทำให้กลยุทธ์นี้มากง่ายต่อการใช้ เมื่อคุณตระหนักถึงการรักษาบางส่วนได้รับการสุ่มแหล่งข้อมูลขนาดใหญ่สามารถให้ข้อมูลที่เป็นผลที่คุณต้องการในการสั่งซื้อเพื่อเปรียบเทียบผลสำหรับคนที่อยู่ในเงื่อนไขการรักษาและการควบคุม ยกตัวอย่างเช่นในการศึกษาของผลกระทบของการร่างและการทหารบริการ Angrist ทำให้การใช้บันทึกรายได้จากสำนักงานคณะกรรมการประกันสังคม ที่ไม่มีข้อมูลนี้ผลการศึกษาของเขาจะไม่ได้เป็นไปได้ ในกรณีนี้การบริหารจัดการความปลอดภัยทางสังคมเป็นเสมอกับแหล่งข้อมูลขนาดใหญ่ ในฐานะที่เป็นมากขึ้นและแหล่งข้อมูลอื่น ๆ ที่เก็บรวบรวมโดยอัตโนมัติอยู่เราจะมีข้อมูลผลอื่น ๆ ที่สามารถวัดผลกระทบของการเปลี่ยนแปลงที่สร้างขึ้นโดยการเปลี่ยนแปลงจากภายนอก
แสดงให้เห็นถึงกลยุทธ์นี้ในยุคดิจิตอลให้เป็นพิจารณา Mas และเร็ต (2009) การวิจัยเกี่ยวกับผลกระทบที่สง่างามของคนรอบข้างในการผลิต แม้ว่าบนพื้นผิวที่มันอาจจะดูแตกต่างจากการศึกษา Angrist เกี่ยวกับผลกระทบของร่างเวียดนามในโครงสร้างพวกเขาทั้งสองเป็นไปตามรูปแบบใน EQ 2.1
Mas และเร็ตวัดว่าคนรอบข้างส่งผลกระทบต่อการผลิตของแรงงาน ในมือข้างหนึ่งมีเพื่อนทำงานอย่างหนักอาจนำไปสู่แรงงานเพื่อเพิ่มผลผลิตของพวกเขาเพราะแรงกดดัน หรือในทางกลับกัน, เพียร์ทำงานอย่างหนักอาจทำให้คนงานอื่น ๆ ที่จะหย่อนออกมากยิ่งขึ้น วิธีที่ชัดเจนเพื่อศึกษาผลเพียร์ในการผลิตจะได้รับการทดลองควบคุมแบบสุ่มที่คนงานจะสุ่มให้กะกับแรงงานของระดับการผลิตที่แตกต่างกันและการผลิตแล้วส่งผลให้เป็นวัดสำหรับทุกคน นักวิจัย แต่ไม่ได้ควบคุมตารางเวลาของคนงานในธุรกิจจริงใด ๆ และเพื่อให้ Mas และเร็ตมีการพึ่งพาการทดลองทางธรรมชาติที่เกิดขึ้นในซูเปอร์มาร์เก็ต
เช่นเดียวกับ EQ 2.1 การศึกษาของพวกเขามีสองส่วน ก่อนที่พวกเขาใช้บันทึกจากซูเปอร์มาร์เก็ตระบบการชำระเงินที่มีความแม่นยำบุคคลและเสมอในตัวชี้วัดของการผลิต: จำนวนรายการที่สแกนต่อวินาที และประการที่สองเนื่องจากวิธีการจัดตารางเวลาที่ได้ทำที่ซุปเปอร์มาร์เก็ตนี้พวกเขาได้อยู่ใกล้กับองค์ประกอบสุ่มของคนรอบข้าง ในคำอื่น ๆ แม้ว่าการจัดตารางเวลาของพนักงานเก็บเงินไม่ได้กำหนดโดยการจับสลากมันเป็นแบบสุ่มเป็นหลัก ในทางปฏิบัติมีความมั่นใจที่เรามีในการทดลองทางธรรมชาติบ่อยครั้งขึ้นอยู่กับความน่าเชื่อถือของคนนี้ "ถ้าเป็น" อ้างสุ่ม การใช้ประโยชน์จากรูปแบบสุ่มนี้ Mas และเร็ตพบว่าการทำงานกับเพื่อนร่วมงานของผลผลิตที่สูงขึ้นเพิ่มผลผลิต นอกจาก Mas และเร็ตใช้ขนาดและความมีชีวิตชีวาของชุดข้อมูลของพวกเขาที่จะย้ายที่อยู่นอกเหนือการประมาณค่าของสาเหตุและผลกระทบที่จะสำรวจทั้งสองประเด็นที่สำคัญมากขึ้นและลึกซึ้ง: ความแตกต่างของผลกระทบนี้ (ซึ่งชนิดของแรงงานเป็นผลที่มีขนาดใหญ่) และกลไกการ ที่อยู่เบื้องหลังผลกระทบ (ทำไมมีเพื่อนผลผลิตสูงนำไปสู่การผลิตที่สูงขึ้น) เราจะกลับไปทั้งสองที่สำคัญประเด็นความแตกต่างของผลการรักษาและกลไกในบทที่ 5 เมื่อเราพูดคุยเกี่ยวกับการทดลองในรายละเอียดเพิ่มเติม
Generalizing จากการศึกษาเกี่ยวกับผลกระทบของร่างเวียดนามเกี่ยวกับรายได้และการศึกษาผลกระทบของคนรอบข้างในการผลิตที่มีการกำหนดตาราง 2.3 สรุปการศึกษาอื่น ๆ ที่มีโครงสร้างเดียวกันนี้แน่นอน: ใช้เสมอในแหล่งข้อมูลการวัดผลกระทบของเหตุการณ์บางอย่าง . ในฐานะที่เป็นตารางที่ 2.3 ทำให้เห็นได้ชัดการทดลองธรรมชาติมีทุกที่ถ้าคุณเพียงแค่รู้วิธีที่จะมองหาพวกเขา
มุ่งเน้นเนื้อหาสาระ | แหล่งที่มาของการทดลองธรรมชาติ | เสมอกับแหล่งข้อมูล | การอ้างอิง |
---|---|---|---|
Peer ผลกระทบต่อการผลิต | การตั้งเวลา | ข้อมูลที่เช็คเอาท์ | Mas and Moretti (2009) |
การสร้างมิตรภาพ | พายุเฮอริเคน | Phan and Airoldi (2015) | |
การแพร่กระจายของอารมณ์ | ฝน | Coviello et al. (2014) | |
Peer to Peer การถ่ายโอนทางเศรษฐกิจ | แผ่นดินไหว | ข้อมูลเงินมือถือ | Blumenstock, Fafchamps, and Eagle (2011) |
พฤติกรรมการบริโภคส่วนบุคคล | 2013 ปิดรัฐบาลสหรัฐ | ข้อมูลทางการเงินส่วนบุคคล | Baker and Yannelis (2015) |
ผลกระทบทางเศรษฐกิจของระบบ recommender | ต่างๆ | ข้อมูลการท่องเว็บที่ Amazon | Sharma, Hofman, and Watts (2015) |
ผลของความเครียดในเด็กทารกในครรภ์ | 2006 สงครามอิสราเอลบุปผชาติ | ระเบียนแรกเกิด | Torche and Shwed (2015) |
พฤติกรรมการอ่านในวิกิพีเดีย | โองการ Snowden | บันทึกวิกิพีเดีย | Penney (2016) |
ในทางปฏิบัตินักวิจัยใช้สองกลยุทธ์ที่แตกต่างกันสำหรับการค้นหาการทดลองธรรมชาติซึ่งทั้งสองสามารถได้ผลสำเร็จ นักวิจัยบางคนเริ่มต้นด้วยการเสมอกับแหล่งข้อมูลและมองหาเหตุการณ์สุ่มในโลก; คนอื่น ๆ เริ่มต้นด้วยเหตุการณ์สุ่มในโลกและมองหาแหล่งข้อมูลที่จับผลกระทบ สุดท้ายสังเกตเห็นว่ามีความแข็งแรงของการทดลองทางธรรมชาติไม่ได้มาจากความซับซ้อนของการวิเคราะห์ทางสถิติ แต่จากการดูแลในการค้นพบเปรียบเทียบยุติธรรมที่สร้างขึ้นโดยอุบัติเหตุที่โชคดีของประวัติศาสตร์