ในแนวทางที่ครอบคลุมอยู่ในพฤติกรรมการสังเกตหนังสือเล่มนี้ (บทที่ 2) และถามคำถาม (บทที่ 3) นักวิจัยค้นคว้าข้อมูลโดยไม่ได้ตั้งใจและมีการเปลี่ยนแปลงโลกอย่างเป็นระบบ แนวทางที่ครอบคลุมในการทดลองใช้บทนี้มีความแตกต่างกันโดยพื้นฐาน เมื่อนักวิจัยทำการทดลองพวกเขาจะเข้าไปแทรกแซงในโลกอย่างเป็นระบบเพื่อสร้างข้อมูลที่เหมาะอย่างยิ่งสำหรับการตอบคำถามเกี่ยวกับความสัมพันธ์ระหว่างเหตุและผล
คำถามเกี่ยวกับสาเหตุและผลเป็นเรื่องธรรมดาในการวิจัยทางสังคมและตัวอย่างรวมถึงคำถามต่างๆเช่นการเพิ่มเงินเดือนของครูเพิ่มการเรียนรู้ของนักเรียนหรือไม่? ผลกระทบของค่าจ้างขั้นต่ำต่ออัตราการจ้างงานคืออะไร? การแข่งขันของผู้สมัครงานมีผลต่อโอกาสในการได้งานอย่างไร นอกเหนือจากคำถามเชิงสาเหตุอย่างชัดเจนแล้วคำถามที่เป็นเหตุให้เกิดผลกระทบในคำถามทั่วไปเกี่ยวกับการเพิ่มประสิทธิภาพของเมตริกประสิทธิภาพบางอย่างให้มากขึ้น ตัวอย่างเช่นคำถาม "สีอะไรที่ควรจะเป็นปุ่มบริจาคในเว็บไซต์ของ NGO?" มีคำถามมากมายเกี่ยวกับผลกระทบของปุ่มสีต่างๆในการบริจาค
วิธีหนึ่งในการตอบคำถามสาเหตุและผลคือการค้นหารูปแบบข้อมูลที่มีอยู่ ตัวอย่างเช่นการกลับไปที่คำถามเกี่ยวกับผลกระทบของเงินเดือนของครูในการเรียนรู้ของนักเรียนคุณอาจคำนวณว่านักเรียนเรียนรู้เพิ่มเติมในโรงเรียนที่มีเงินเดือนครูสูง แต่ความสัมพันธ์นี้แสดงให้เห็นว่าเงินเดือนที่สูงขึ้น ทำให้ นักเรียนเรียนรู้มากขึ้นหรือไม่? ไม่แน่นอน โรงเรียนที่ครูมีรายได้มากขึ้นอาจแตกต่างกันไปในหลาย ๆ ด้าน ตัวอย่างเช่นนักเรียนในโรงเรียนที่มีเงินเดือนครูสูงอาจมาจากครอบครัวที่มั่งคั่ง ดังนั้นสิ่งที่ดูเหมือนว่าผลของครูอาจมาจากการเปรียบเทียบรูปแบบต่างๆของนักเรียน ความแตกต่างที่ไม่ได้รับการยอมรับระหว่างนักเรียนเหล่านี้เรียกว่า confounders และโดยทั่วไปแล้วความเป็นไปได้ที่จะเกิด confounders ส่งผลต่อความสามารถในการตอบคำถามสาเหตุและผลกระทบของนักวิจัยด้วยการมองหารูปแบบของข้อมูลที่มีอยู่
ทางออกหนึ่งในการแก้ปัญหาของสารก่อภูมิแพ้คือพยายามที่จะทำการเปรียบเทียบอย่างเป็นธรรมโดยการปรับค่าความแตกต่างระหว่างกลุ่ม ตัวอย่างเช่นคุณอาจสามารถดาวน์โหลดข้อมูลภาษีทรัพย์สินจากเว็บไซต์ของรัฐบาลได้หลายแห่ง จากนั้นคุณสามารถเปรียบเทียบผลการปฏิบัติงานของนักเรียนในโรงเรียนที่มีราคาใกล้เคียงกัน แต่เงินเดือนของครูแตกต่างกันไปและคุณอาจยังพบว่านักเรียนเรียนรู้เพิ่มเติมในโรงเรียนที่มีค่าตอบแทนครูที่สูงขึ้น แต่ยังคงมีหลายปัจจัยที่เป็นไปได้ บางทีพ่อแม่ของนักเรียนเหล่านี้อาจแตกต่างกันในระดับการศึกษา หรืออาจแตกต่างจากความใกล้ชิดกับห้องสมุดสาธารณะ หรือบางทีโรงเรียนที่มีค่าตอบแทนครูสูงกว่าก็มีการจ่ายเงินให้กับผู้บริหารที่สูงขึ้นและการจ่ายเงินหลักไม่ใช่การจ่ายเงินของครูคือสิ่งที่เพิ่มขึ้นในการเรียนรู้ของนักเรียน คุณสามารถลองวัดและปรับปัจจัยเหล่านี้ได้เช่นกัน แต่รายการสารก่อกวนที่เป็นไปได้นั้นไม่มีที่สิ้นสุด ในหลาย ๆ สถานการณ์คุณไม่สามารถวัดและปรับตัวให้เหมาะสมกับปัจจัยรบกวนทั้งหมดได้ ในการตอบสนองต่อความท้าทายนี้นักวิจัยได้พัฒนาเทคนิคหลายอย่างในการประมาณค่าเชิงสาเหตุจากข้อมูลที่ไม่ใช่ข้อมูลทดลองซึ่งเราได้กล่าวถึงบางส่วนในบทที่ 2 แต่สำหรับคำถามบางประเภทเทคนิคเหล่านี้มีข้อ จำกัด และการทดลองมีแนวโน้มที่จะเป็นไปได้ ทางเลือก
การทดลองช่วยให้นักวิจัยสามารถก้าวข้ามความสัมพันธ์ของข้อมูลที่เกิดขึ้นตามธรรมชาติเพื่อให้สามารถตอบคำถามเกี่ยวกับสาเหตุและผลกระทบได้อย่างน่าเชื่อถือ ในยุคอนาล็อกการทดลองมักยากลำบากและมีราคาแพง ขณะนี้ในยุคดิจิทัลข้อ จำกัด ด้านจิสติกส์จะค่อยๆจางหายไป ไม่เพียง แต่จะง่ายกว่าการทดลองเช่นเดียวกับที่ทำในอดีตก็คือตอนนี้สามารถเรียกใช้การทดลองชนิดใหม่ได้
ในสิ่งที่ฉันได้เขียนไว้แล้วฉันรู้สึกไม่สบายใจในภาษาของฉัน แต่เป็นเรื่องสำคัญที่ต้องแยกแยะระหว่างสองสิ่งคือการทดลองและการทดลองที่มีการควบคุมแบบสุ่ม ในการ ทดลอง นักวิจัยแทรกแซงในโลกแล้ววัดผลลัพธ์ ฉันเคยได้ยินวิธีนี้อธิบายว่าเป็น "perturb และสังเกต." ในการ ทดลองที่ มี การควบคุมแบบสุ่ม นักวิจัยแทรกแซงสำหรับบางคนไม่ใช่สำหรับคนอื่น ๆ และนักวิจัยตัดสินใจว่าคนที่ได้รับการแทรกแซงโดยการสุ่มตัวอย่าง (เช่นพลิกเหรียญ) การทดลองที่ได้รับการควบคุมแบบสุ่มสร้างการเปรียบเทียบที่เป็นธรรมระหว่างสองกลุ่ม: กลุ่มที่ได้รับการแทรกแซงและกลุ่มที่ไม่ได้รับการรักษา กล่าวอีกนัยหนึ่งการทดลองแบบควบคุมแบบสุ่มเป็นการแก้ปัญหาของสารก่อการร้าย การทดลองกับ Perturb และสังเกตจะเกี่ยวข้องกับกลุ่มเดียวที่ได้รับการแทรกแซงดังนั้นผลลัพธ์ที่ได้จะนำไปสู่ข้อสรุปที่ไม่ถูกต้องนักวิจัยสรุปได้ว่า แม้จะมีความแตกต่างที่สำคัญระหว่างการทดลองและการทดลองที่มีการควบคุมแบบสุ่มนักวิจัยทางสังคมมักใช้คำเหล่านี้แทนกัน ฉันจะทำตามอนุสัญญานี้ แต่ในบางประเด็นฉันจะทำลายการประชุมเพื่อเน้นคุณค่าของการทดลองที่มีการควบคุมแบบสุ่มมากกว่าการทดลองโดยไม่มีการสุ่มตัวอย่างและกลุ่มควบคุม
การทดลองที่มีการควบคุมแบบสุ่มได้พิสูจน์แล้วว่าเป็นวิธีที่มีประสิทธิภาพในการเรียนรู้เกี่ยวกับโลกทางสังคมและในบทนี้ผมจะแสดงให้คุณเห็นถึงวิธีใช้ในการวิจัยของคุณ ในส่วนที่ 4.2 ฉันจะอธิบายตรรกะพื้นฐานของการทดลองด้วยตัวอย่างของการทดลองในวิกิพีเดีย จากนั้นในส่วน 4.3 ฉันจะอธิบายถึงความแตกต่างระหว่างการทดลองในห้องทดลองกับการทดลองภาคสนามและความแตกต่างระหว่างการทดลองอะนาล็อกและการทดลองแบบดิจิทัล นอกจากนี้ฉันจะยืนยันว่าการทดลองภาคสนามแบบดิจิทัลสามารถนำเสนอคุณลักษณะที่ดีที่สุดสำหรับการทดลองในห้องทดลองแบบอนาล็อก (การควบคุมแบบแน่นหนา) และการทดลองภาคสนามแบบอะนาล็อก (สมจริง) ในระดับที่ไม่สามารถทำได้ก่อนหน้านี้ ถัดไปในส่วนที่ 4.4 ฉันจะอธิบายสามแนวคิด - ความถูกต้องความหลากหลายของผลการรักษาและกลไกต่างๆที่สำคัญสำหรับการออกแบบการทดลองที่ร่ำรวย ด้วยพื้นฐานดังกล่าวฉันจะอธิบายถึงข้อดีข้อเสียที่เกี่ยวข้องกับสองกลยุทธ์หลักในการดำเนินการทดลองดิจิทัล: ทำด้วยตัวคุณเองหรือร่วมมือกับผู้มีอำนาจ สุดท้ายนี้ผมจะสรุปคำแนะนำเกี่ยวกับการออกแบบเกี่ยวกับวิธีที่คุณสามารถใช้ประโยชน์จากพลังที่แท้จริงของการทดลองแบบดิจิตอลได้ (หัวข้อ 4.6.1) และอธิบายบางส่วนของความรับผิดชอบที่มาพร้อมกับพลังอำนาจ (ส่วน 4.6.2)