2.4.3.1 การทดลองธรรมชาติ

การทดลองธรรมชาติใช้ประโยชน์จากเหตุการณ์สุ่มในโลก เหตุการณ์สุ่ม + ตลอดเวลาในระบบข้อมูล = ทดลองทางธรรมชาติ

กุญแจสำคัญในการสุ่มทดลองควบคุมการเปิดใช้งานการเปรียบเทียบยุติธรรมสุ่ม แต่บางครั้งสิ่งที่เกิดขึ้นในโลกที่เป็นหลักกำหนดคนสุ่มหรือเกือบสุ่มการรักษาที่แตกต่างกัน หนึ่งในตัวอย่างที่ชัดเจนของกลยุทธ์ของการใช้การทดลองธรรมชาติที่มาจากการวิจัยของ Angrist (1990) ที่มีขนาดผลของการบริการทหารกำไร

ในช่วงสงครามเวียดนามในสหรัฐอเมริกาเพิ่มขนาดของกองกำลังติดอาวุธของตนผ่​​านร่าง เพื่อที่จะตัดสินใจที่ประชาชนจะได้รับการเรียกว่าเป็นบริการที่รัฐบาลสหรัฐจัดขึ้นจับสลาก ทุกวันเกิดเป็นตัวแทนบนแผ่นกระดาษและเอกสารเหล่านี้ถูกวางไว้ในขวดแก้วขนาดใหญ่ ดังแสดงในรูป 2.5 ใบนี้ของกระดาษที่ถูกดึงออกมาจากขวดหนึ่งครั้งเพื่อกำหนดลำดับที่ชายหนุ่มจะเรียกว่าการให้บริการ (หญิงสาวก็ไม่ใช่เรื่องที่จะร่าง) บนพื้นฐานของผลคนเกิดวันที่ 14 กันยายนที่ถูกเรียกว่าครั้งแรกที่คนเกิดวันที่ 24 เมษายนที่ถูกเรียกว่าสองและอื่น ๆ ในท้ายที่สุดในการจับสลากนี้คนเกิดวันที่ 195 วันที่แตกต่างถูกเรียกว่าการให้บริการในขณะที่คนเกิดวันที่ 171 วันที่ไม่ได้เรียก

รูปที่ 2.5: สมาชิกสภาคองเกรสของอเล็กซานเด Pirnie (R-NY) วาดรูปแคปซูลครั้งแรกสำหรับร่าง Selective บริการเมื่อวันที่ 1 ธันวาคม 1969 โจชัว Angrist (1990) รวมหวยร่างกับข้อมูลรายได้จากการบริหารจัดการความปลอดภัยทางสังคมที่จะประเมินผลกระทบของการรับราชการทหาร เกี่ยวกับรายได้ นี่คือตัวอย่างของการวิจัยโดยใช้การทดลองธรรมชาติ ที่มา: วิกิพีเดีย

รูปที่ 2.5: สมาชิกสภาคองเกรสของอเล็กซานเด Pirnie (R-NY) วาดรูปแคปซูลครั้งแรกสำหรับร่าง Selective บริการเมื่อวันที่ 1 ธันวาคม 1969 โจชัว Angrist (1990) รวมหวยร่างกับข้อมูลรายได้จากการบริหารจัดการความปลอดภัยทางสังคมที่จะประเมินผลกระทบของการรับราชการทหาร เกี่ยวกับรายได้ นี่คือตัวอย่างของการวิจัยโดยใช้การทดลองธรรมชาติ ที่มา: วิกิพีเดีย

แม้ว่ามันอาจจะไม่ปรากฏทันทีร่างหวยมีความคล้ายคลึงกันที่สำคัญในการทดลองควบคุมแบบสุ่ม: ในสถานการณ์ที่ทั้งสองเข้าร่วมจะสุ่มให้ได้รับการรักษา ในกรณีของร่างหวยถ้าเรามีความสนใจในการเรียนรู้เกี่ยวกับผลกระทบของร่างคุณสมบัติและการรับราชการทหารเกี่ยวกับรายได้ในตลาดแรงงานที่ตามมาเราสามารถเปรียบเทียบผลสำหรับคนที่มีวันเกิดใต้ตัดการจับสลาก (เช่น 14 กันยายน, เมษายน 24 ฯลฯ ) กับผลสำหรับคนที่มีวันคล้ายวันเกิดได้หลังจากตัด (เช่นวันที่ 20 กุมภาพันธ์ที่ 2 ธันวาคม ฯลฯ )

ระบุว่าการรักษาถูกเกณฑ์นี้ได้รับการสุ่มจากนั้นเราจะสามารถวัดผลของการรักษานี้ได้ผลใด ๆ ที่ได้รับการวัด ยกตัวอย่างเช่น Angrist (1990) รวมข้อมูลเกี่ยวกับผู้ได้รับการสุ่มเลือกในร่างกับข้อมูลรายได้ที่เก็บรวบรวมโดยสำนักงานคณะกรรมการประกันสังคมที่จะสรุปว่าผลประกอบการของทหารผ่านศึกสีขาวมีประมาณ 15% น้อยกว่ารายได้ของเทียบเคียงทหารผ่านศึกที่ไม่ใช่ที่ . นักวิจัยคนอื่นได้ใช้เคล็ดลับที่คล้ายกันเป็นอย่างดี ยกตัวอย่างเช่น Conley and Heerwig (2011) รวมข้อมูลเกี่ยวกับผู้ได้รับการสุ่มเลือกในร่างกับข้อมูลที่ใช้ในครัวเรือนที่เก็บรวบรวมจากการสำรวจ 2000 การสำรวจสำมะโนประชากร 2005 และชุมชนชาวอเมริกันและพบว่าตราบหลังจากร่างมีผลระยะยาวเล็ก ๆ น้อย ๆ รับราชการทหารอยู่กับความหลากหลายของผลเช่นการครอบครองที่อยู่อาศัย (เจ้าของเมื่อเทียบกับการให้เช่า) และความมั่นคงที่อยู่อาศัย (โอกาสของการเดินในห้าปีก่อน)

เป็นตัวอย่างนี้แสดงให้เห็นบางครั้งสังคมการเมืองหรือธรรมชาติสร้างกองกำลังทดลองหรือใกล้ทดลองที่สามารถ leveraged โดยนักวิจัย บ่อยครั้งที่การทดลองธรรมชาติเป็นวิธีที่ดีที่สุดในการประเมินความสัมพันธ์ระหว่างสาเหตุและผลกระทบในการตั้งค่าที่มันไม่จริยธรรมหรือการปฏิบัติที่จะใช้การทดสอบแบบสุ่ม พวกเขาเป็นกลยุทธ์ที่สำคัญสำหรับการค้นพบการเปรียบเทียบเป็นธรรมในข้อมูลที่ไม่ใช่การทดลอง กลยุทธ์การวิจัยครั้งนี้สามารถสรุปได้จากสมการนี​​้:

\ [\ {ข้อความสุ่ม (หรือถ้าสุ่ม) เหตุการณ์} + \ ข้อความ {เสมอในการสตรีมข้อมูล} = \ ข้อความ {ทดลองทางธรรมชาติ} \ qquad (2.1) \]

อย่างไรก็ตามการวิเคราะห์การทดลองธรรมชาติที่สามารถจะค่อนข้างยุ่งยาก ยกตัวอย่างเช่นในกรณีของร่างเวียดนามทุกคนไม่ได้ซึ่งเป็นร่างที่มีสิทธิ์จบลงด้วยการให้บริการ (มีความหลากหลายของการยกเว้น) และในขณะเดียวกันบางคนที่ไม่ได้ถูกร่างที่มีสิทธิ์อาสาสำหรับการให้บริการ มันเป็นเหมือนกับว่าในการทดลองทางคลินิกของยาเสพติดใหม่บางคนที่อยู่ในกลุ่มการรักษาไม่ได้ใช้ยาของพวกเขาและบางส่วนของคนที่อยู่ในกลุ่มควบคุมอย่างใดได้รับยาเสพติด ปัญหานี้เรียกว่าการไม่ปฏิบัติตามสองด้านเช่นเดียวกับปัญหาอื่น ๆ ที่อธิบายไว้ในรายละเอียดมากขึ้นในบางส่วนของการอ่านที่แนะนำในตอนท้ายของบทนี้

กลยุทธ์ของการใช้ประโยชน์จากธรรมชาติที่เกิดขึ้นได้รับมอบหมายสุ่มแจ๋วยุคดิจิตอล แต่ความชุกของข้อมูลขนาดใหญ่ทำให้กลยุทธ์นี้มากง่ายต่อการใช้ เมื่อคุณตระหนักถึงการรักษาบางส่วนได้รับการสุ่มแหล่งข้อมูลขนาดใหญ่สามารถให้ข้อมูลที่เป็นผลที่คุณต้องการในการสั่งซื้อเพื่อเปรียบเทียบผลสำหรับคนที่อยู่ในเงื่อนไขการรักษาและการควบคุม ยกตัวอย่างเช่นในการศึกษาของผลกระทบของการร่างและการทหารบริการ Angrist ทำให้การใช้บันทึกรายได้จากสำนักงานคณะกรรมการประกันสังคม ที่ไม่มีข้อมูลนี้ผลการศึกษาของเขาจะไม่ได้เป็นไปได้ ในกรณีนี้การบริหารจัดการความปลอดภัยทางสังคมเป็นเสมอกับแหล่งข้อมูลขนาดใหญ่ ในฐานะที่เป็นมากขึ้นและแหล่งข้อมูลอื่น ๆ ที่เก็บรวบรวมโดยอัตโนมัติอยู่เราจะมีข้อมูลผลอื่น ๆ ที่สามารถวัดผลกระทบของการเปลี่ยนแปลงที่สร้างขึ้นโดยการเปลี่ยนแปลงจากภายนอก

แสดงให้เห็นถึงกลยุทธ์นี้ในยุคดิจิตอลให้เป็นพิจารณา Mas และเร็ต (2009) การวิจัยเกี่ยวกับผลกระทบที่สง่างามของคนรอบข้างในการผลิต แม้ว่าบนพื้นผิวที่มันอาจจะดูแตกต่างจากการศึกษา Angrist เกี่ยวกับผลกระทบของร่างเวียดนามในโครงสร้างพวกเขาทั้งสองเป็นไปตามรูปแบบใน EQ 2.1

Mas และเร็ตวัดว่าคนรอบข้างส่งผลกระทบต่อการผลิตของแรงงาน ในมือข้างหนึ่งมีเพื่อนทำงานอย่างหนักอาจนำไปสู่​​แรงงานเพื่อเพิ่มผลผลิตของพวกเขาเพราะแรงกดดัน หรือในทางกลับกัน, เพียร์ทำงานอย่างหนักอาจทำให้คนงานอื่น ๆ ที่จะหย่อนออกมากยิ่งขึ้น วิธีที่ชัดเจนเพื่อศึกษาผลเพียร์ในการผลิตจะได้รับการทดลองควบคุมแบบสุ่มที่คนงานจะสุ่มให้กะกับแรงงานของระดับการผลิตที่แตกต่างกันและการผลิตแล้วส่งผลให้เป็นวัดสำหรับทุกคน นักวิจัย แต่ไม่ได้ควบคุมตารางเวลาของคนงานในธุรกิจจริงใด ๆ และเพื่อให้ Mas และเร็ตมีการพึ่งพาการทดลองทางธรรมชาติที่เกิดขึ้นในซูเปอร์มาร์เก็ต

เช่นเดียวกับ EQ 2.1 การศึกษาของพวกเขามีสองส่วน ก่อนที่พวกเขาใช้บันทึกจากซูเปอร์มาร์เก็ตระบบการชำระเงินที่มีความแม่นยำบุคคลและเสมอในตัวชี้วัดของการผลิต: จำนวนรายการที่สแกนต่อวินาที และประการที่สองเนื่องจากวิธีการจัดตารางเวลาที่ได้ทำที่ซุปเปอร์มาร์เก็ตนี้พวกเขาได้อยู่ใกล้กับองค์ประกอบสุ่มของคนรอบข้าง ในคำอื่น ๆ แม้ว่าการจัดตารางเวลาของพนักงานเก็บเงินไม่ได้กำหนดโดยการจับสลากมันเป็นแบบสุ่มเป็นหลัก ในทางปฏิบัติมีความมั่นใจที่เรามีในการทดลองทางธรรมชาติบ่อยครั้งขึ้นอยู่กับความน่าเชื่อถือของคนนี้ "ถ้าเป็น" อ้างสุ่ม การใช้ประโยชน์จากรูปแบบสุ่มนี้ Mas และเร็ตพบว่าการทำงานกับเพื่อนร่วมงานของผลผลิตที่สูงขึ้นเพิ่มผลผลิต นอกจาก Mas และเร็ตใช้ขนาดและความมีชีวิตชีวาของชุดข้อมูลของพวกเขาที่จะย้ายที่อยู่นอกเหนือการประมาณค่าของสาเหตุและผลกระทบที่จะสำรวจทั้งสองประเด็นที่สำคัญมากขึ้นและลึกซึ้ง: ความแตกต่างของผลกระทบนี้ (ซึ่งชนิดของแรงงานเป็นผลที่มีขนาดใหญ่) และกลไกการ ที่อยู่เบื้องหลังผลกระทบ (ทำไมมีเพื่อนผลผลิตสูงนำไปสู่​​การผลิตที่สูงขึ้น) เราจะกลับไปทั้งสองที่สำคัญประเด็นความแตกต่างของผลการรักษาและกลไกในบทที่ 5 เมื่อเราพูดคุยเกี่ยวกับการทดลองในรายละเอียดเพิ่มเติม

Generalizing จากการศึกษาเกี่ยวกับผลกระทบของร่างเวียดนามเกี่ยวกับรายได้และการศึกษาผลกระทบของคนรอบข้างในการผลิตที่มีการกำหนดตาราง 2.3 สรุปการศึกษาอื่น ๆ ที่มีโครงสร้างเดียวกันนี้แน่นอน: ใช้เสมอในแหล่งข้อมูลการวัดผลกระทบของเหตุการณ์บางอย่าง . ในฐานะที่เป็นตารางที่ 2.3 ทำให้เห็นได้ชัดการทดลองธรรมชาติมีทุกที่ถ้าคุณเพียงแค่รู้วิธีที่จะมองหาพวกเขา

ตารางที่ 2.3: ตัวอย่างของการทดลองธรรมชาติโดยใช้แหล่งข้อมูลขนาดใหญ่ การศึกษาทั้งหมดเหล่านี้เป็นไปตามสูตรพื้นฐานเดียวกันสุ่ม (หรือถ้าสุ่ม) + เหตุการณ์ตลอดเวลาในระบบข้อมูล ดู Dunning (2012) สำหรับตัวอย่างเพิ่มเติม
มุ่งเน้นเนื้อหาสาระ แหล่งที่มาของการทดลองธรรมชาติ เสมอกับแหล่งข้อมูล การอ้างอิง
Peer ผลกระทบต่อการผลิต การตั้งเวลา ข้อมูลที่เช็คเอาท์ Mas and Moretti (2009)
การสร้างมิตรภาพ พายุเฮอริเคน Facebook Phan and Airoldi (2015)
การแพร่กระจายของอารมณ์ ฝน Facebook Coviello et al. (2014)
Peer to Peer การถ่ายโอนทางเศรษฐกิจ แผ่นดินไหว ข้อมูลเงินมือถือ Blumenstock, Fafchamps, and Eagle (2011)
พฤติกรรมการบริโภคส่วนบุคคล 2013 ปิดรัฐบาลสหรัฐ ข้อมูลทางการเงินส่วนบุคคล Baker and Yannelis (2015)
ผลกระทบทางเศรษฐกิจของระบบ recommender ต่างๆ ข้อมูลการท่องเว็บที่ Amazon Sharma, Hofman, and Watts (2015)
ผลของความเครียดในเด็กทารกในครรภ์ 2006 สงครามอิสราเอลบุปผชาติ ระเบียนแรกเกิด Torche and Shwed (2015)
พฤติกรรมการอ่านในวิกิพีเดีย โองการ Snowden บันทึกวิกิพีเดีย Penney (2016)

ในทางปฏิบัตินักวิจัยใช้สองกลยุทธ์ที่แตกต่างกันสำหรับการค้นหาการทดลองธรรมชาติซึ่งทั้งสองสามารถได้ผลสำเร็จ นักวิจัยบางคนเริ่มต้นด้วยการเสมอกับแหล่งข้อมูลและมองหาเหตุการณ์สุ่มในโลก; คนอื่น ๆ เริ่มต้นด้วยเหตุการณ์สุ่มในโลกและมองหาแหล่งข้อมูลที่จับผลกระทบ สุดท้ายสังเกตเห็นว่ามีความแข็งแรงของการทดลองทางธรรมชาติไม่ได้มาจากความซับซ้อนของการวิเคราะห์ทางสถิติ แต่จากการดูแลในการค้นพบเปรียบเทียบยุติธรรมที่สร้างขึ้นโดยอุบัติเหตุที่โชคดีของประวัติศาสตร์