2.4.3 การทดลองใกล้เคียง

เราสามารถใกล้เคียงกับการทดลองที่เราไม่สามารถทำได้ วิธีที่สองโดยเฉพาะอย่างยิ่งได้รับประโยชน์จากยุคดิจิตอลได้รับการจับคู่และการทดลองทางธรรมชาติ

คำถามทางวิทยาศาสตร์และนโยบายที่สำคัญหลายคนมีสาเหตุ ลองพิจารณาตัวอย่างเช่นคำถามต่อไปนี้สิ่งที่เป็นผลของโปรแกรมการฝึกอบรมเกี่ยวกับค่าจ้างงาน? วิธีการหนึ่งที่จะตอบคำถามนี้จะมีการทดลองควบคุมแบบสุ่มคนงานที่ถูกสุ่มให้ได้รับการฝึกอบรมอย่างใดอย่างหนึ่งหรือไม่ได้รับการฝึกอบรม จากนั้นนักวิจัยสามารถประมาณการผลกระทบของการฝึกอบรมสำหรับผู้เข้าร่วมเหล่านี้โดยเพียงแค่การเปรียบเทียบค่าจ้างของคนที่ได้รับการฝึกอบรมให้กับผู้ที่ไม่ได้รับมัน

เปรียบเทียบง่ายๆคือถูกต้องเพราะสิ่งที่เกิดขึ้นก่อนที่ข้อมูลจะถูกเก็บรวบรวมแม้: สุ่ม โดยไม่ต้องสุ่มที่เป็นปัญหามาก trickier นักวิจัยสามารถเปรียบเทียบค่าจ้างของคนที่สมัครใจลงทะเบียนสำหรับการฝึกอบรมให้กับผู้ที่ไม่ได้ลงทะเบียน เปรียบเทียบว่าอาจจะแสดงให้เห็นว่าคนที่ได้รับการฝึกอบรมได้รับมากขึ้น แต่เท่าใดของนี้เป็นเพราะการฝึกอบรมและวิธีการมากนี้เป็นเพราะคนที่ลงทะเบียนสำหรับการฝึกอบรมมีความแตกต่างจากผู้ที่ไม่ได้ลงทะเบียนสำหรับการฝึกอบรม? ในคำอื่น ๆ มันไม่ยุติธรรมที่จะเปรียบเทียบค่าจ้างของทั้งสองกลุ่มของคนที่?

ความกังวลเกี่ยวกับการเปรียบเทียบยุติธรรมนี้นำไปสู่นักวิจัยบางคนจะเชื่อว่ามันเป็นไปไม่ได้ที่จะทำให้ประมาณการสาเหตุโดยไม่ต้องใช้การทดลอง การเรียกร้องนี้ไปไกลเกินไป ในขณะที่มันเป็นความจริงที่การทดลองให้หลักฐานที่แข็งแกร่งสำหรับผลกระทบเชิงสาเหตุมีกลยุทธ์อื่น ๆ ที่สามารถให้ข้อมูลประมาณการเชิงสาเหตุที่มีคุณค่า แทนที่จะคิดว่าประมาณการสาเหตุมีทั้งง่าย (ในกรณีของการทดลอง) หรือเป็นไปไม่ได้ (ในกรณีของการสังเกตข้อมูลเฉยๆ) มันจะดีกว่าที่จะคิดว่ากลยุทธ์สำหรับการทำประมาณการสาเหตุนอนพร้อมความต่อเนื่องจากการที่แข็งแกร่งในการที่อ่อนแอที่สุด (รูปที่ 2.4) ในตอนท้ายของการที่แข็งแกร่งต่อเนื่องที่มีการสุ่มทดลองควบคุม แต่เหล่านี้มักจะยากที่จะทำในการวิจัยทางสังคมเพราะการรักษาจำนวนมากจำเป็นต้องใช้ในปริมาณที่ไม่สมจริงของความร่วมมือจากรัฐบาลหรือ บริษัท ที่; ค่อนข้างง่ายมีการทดลองหลายอย่างที่เราไม่สามารถทำ ฉันจะอุทิศทั้งหมดของบทที่ 4 ทั้งจุดแข็งและจุดอ่อนของการทดลองควบคุมแบบสุ่มและฉันจะยืนยันว่าในบางกรณีที่มีเหตุผลทางจริยธรรมที่แข็งแกร่งจะชอบการสังเกตวิธีการทดลอง

รูปที่ 2.4: ความต่อเนื่องของกลยุทธ์การวิจัยสำหรับผลกระทบที่คาดสาเหตุ

รูปที่ 2.4: ความต่อเนื่องของกลยุทธ์การวิจัยสำหรับผลกระทบที่คาดสาเหตุ

ย้ายตามความต่อเนื่องที่มีสถานการณ์ที่นักวิจัยได้สุ่มไม่ได้อย่างชัดเจน นั่นคือนักวิจัยกำลังพยายามที่จะเรียนรู้ความรู้ทดลองเหมือนจริงโดยไม่ต้องทำการทดลอง; ธรรมชาตินี้เป็นไปได้ยาก แต่ข้อมูลขนาดใหญ่มากช่วยเพิ่มความสามารถของเราที่จะทำให้ประมาณการสาเหตุในสถานการณ์เหล่านี้

บางครั้งมีการตั้งค่าที่สุ่มในโลกที่เกิดขึ้นในการสร้างสิ่งที่ชอบทดลองสำหรับนักวิจัย การออกแบบเหล่านี้จะเรียกว่าการทดลองธรรมชาติและพวกเขาจะได้รับการพิจารณาในรายละเอียดในมาตรา 2.4.3.1 สองคุณสมบัติของแหล่งที่มาของพวกเขาข้อมูลขนาดใหญ่เสมอในธรรมชาติของพวกเขาและขนาดช่วยเพิ่มความสามารถของเราที่จะเรียนรู้จากการทดลองธรรมชาติเมื่อพวกเขาเกิดขึ้น

ย้ายห่างไกลจากการทดลองควบคุมแบบสุ่มบางครั้งไม่มีแม้แต่เหตุการณ์ในลักษณะที่เราสามารถใช้ที่ใกล้เคียงกับการทดลองทางธรรมชาติ ในการตั้งค่าเหล่านี้เราสามารถสร้างอย่างระมัดระวังรถที่อยู่ในข้อมูลที่ไม่ใช่การทดลองในความพยายามที่จะใกล้เคียงกับการทดลอง การออกแบบเหล่านี้จะเรียกว่าการจับคู่และพวกเขาจะได้รับการพิจารณาในรายละเอียดในมาตรา 2.4.3.2 เช่นเดียวกับการทดลองธรรมชาติที่ตรงกันคือการออกแบบที่ยังได้รับประโยชน์จากแหล่งข้อมูลขนาดใหญ่ โดยเฉพาะอย่างยิ่งขนาดใหญ่ทั้งในแง่ของจำนวนผู้ป่วยและชนิดของข้อมูลต่อกรณีการจับคู่ช่วยอำนวยความสะดวก ความแตกต่างที่สำคัญระหว่างการทดลองทางธรรมชาติและการจับคู่ที่อยู่ในการทดลองนักวิจัยธรรมชาติรู้กระบวนการที่การรักษาที่ได้รับมอบหมายและเชื่อว่ามันจะเป็นแบบสุ่ม

แนวคิดของการเปรียบเทียบยุติธรรมว่าแรงบันดาลใจปรารถนาที่จะทำการทดลองยังรองรับทั้งสองวิธีการทางเลือก: การทดลองในธรรมชาติและการจับคู่ วิธีการเหล่านี้จะช่วยให้คุณสามารถที่จะประเมินผลกระทบสาเหตุจากข้อมูลที่สังเกตเฉยๆโดยการค้นพบการเปรียบเทียบยุติธรรมนั่งอยู่ภายในของข้อมูลที่คุณมีอยู่แล้ว