इस पुस्तक-पर्यवेक्षण व्यवहार (अध्याय 2) में अब तक शामिल दृष्टिकोणों में और प्रश्न पूछने (अध्याय 3) - शोधकर्ता जानबूझकर और व्यवस्थित रूप से दुनिया को बदलने के बिना डेटा एकत्र करते हैं। इस अध्याय-चल रहे प्रयोगों में शामिल दृष्टिकोण - मूल रूप से अलग है। जब शोधकर्ता प्रयोग चलाते हैं, तो वे व्यवस्थित रूप से डेटा बनाने के लिए हस्तक्षेप करते हैं जो आदर्श और प्रभाव संबंधों के बारे में सवालों के जवाब देने के लिए उपयुक्त है।
सामाजिक शोध में कारण और प्रभाव प्रश्न बहुत आम हैं, और उदाहरणों में ऐसे प्रश्न शामिल हैं: क्या शिक्षक वेतन बढ़ाना छात्र सीखने में वृद्धि करता है? रोजगार दरों पर न्यूनतम मजदूरी का असर क्या है? नौकरी आवेदक की दौड़ नौकरी पाने का मौका कैसे प्रभावित करती है? इन स्पष्ट रूप से कारण प्रश्नों के अतिरिक्त, कभी-कभी कारण-प्रभाव प्रभाव कुछ प्रदर्शन मीट्रिक को अधिकतम करने के बारे में अधिक सामान्य प्रश्नों में अंतर्निहित होते हैं। उदाहरण के लिए, प्रश्न "एनजीओ की वेबसाइट पर दान बटन क्या रंग होना चाहिए?" वास्तव में दान पर विभिन्न बटन रंगों के प्रभाव के बारे में बहुत सारे प्रश्न हैं।
मौजूदा डेटा में पैटर्न देखने के लिए कारण और प्रभाव वाले प्रश्नों का उत्तर देने का एक तरीका है। उदाहरण के लिए, छात्र सीखने पर शिक्षक वेतन के प्रभाव के बारे में प्रश्न पर लौटने पर, आप गणना कर सकते हैं कि छात्र उन स्कूलों में और अधिक सीखते हैं जो उच्च शिक्षक वेतन प्रदान करते हैं। लेकिन, क्या यह सहसंबंध दिखाता है कि उच्च वेतन छात्रों को और अधिक सीखने का कारण बनता है ? बिलकूल नही। जिन स्कूलों में शिक्षकों की कमाई होती है वे कई तरीकों से भिन्न हो सकते हैं। उदाहरण के लिए, उच्च शिक्षक वेतन वाले स्कूलों में छात्र समृद्ध परिवारों से आ सकते हैं। इस प्रकार, शिक्षकों के प्रभाव की तरह दिखता है कि वे विभिन्न प्रकार के छात्रों की तुलना में आ सकते हैं। छात्रों के बीच इन अनजान मतभेदों को confounders कहा जाता है, और, सामान्य रूप से, confounders की संभावना मौजूदा डेटा में पैटर्न की तलाश करके शोधकर्ताओं की कारणों और प्रभाव के सवालों के जवाब देने की क्षमता पर विनाश को खत्म कर देता है।
Confounders की समस्या का एक समाधान समूहों के बीच देखने योग्य मतभेदों को समायोजित करके उचित तुलना करने की कोशिश करना है। उदाहरण के लिए, आप कई सरकारी वेबसाइटों से संपत्ति कर डेटा डाउनलोड करने में सक्षम हो सकते हैं। फिर, आप उन स्कूलों में छात्र प्रदर्शन की तुलना कर सकते हैं जहां घर की कीमतें समान हैं लेकिन शिक्षक वेतन अलग हैं, और आप अभी भी पाएंगे कि छात्र उच्च शिक्षक वेतन वाले स्कूलों में और अधिक सीखते हैं। लेकिन अभी भी कई संभावित confounders हैं। शायद इन छात्रों के माता-पिता अपने शिक्षा के स्तर में भिन्न हैं। या शायद स्कूल सार्वजनिक पुस्तकालयों के निकटता में भिन्न हो सकते हैं। या शायद उच्च शिक्षक वेतन वाले स्कूलों के पास प्रिंसिपल के लिए उच्च वेतन भी है, और मुख्य वेतन, शिक्षक वेतन नहीं, वास्तव में छात्र सीखने में वृद्धि क्या है। आप इन कारकों के लिए मापने और समायोजित करने का प्रयास कर सकते हैं, लेकिन संभावित confounders की सूची अनिवार्य रूप से अंतहीन है। कई परिस्थितियों में, आप बस सभी संभावित confounders के लिए माप और समायोजित नहीं कर सकते हैं। इस चुनौती के जवाब में, शोधकर्ताओं ने गैर-प्रयोगात्मक डेटा से कारण अनुमान बनाने के लिए कई तकनीकों का विकास किया है- मैंने उनमें से कुछ को अध्याय 2 में चर्चा की- लेकिन, कुछ प्रकार के प्रश्नों के लिए, ये तकनीक सीमित हैं, और प्रयोग एक वादा करते हैं वैकल्पिक।
प्रयोग कुछ कारणों और प्रभाव वाले सवालों के विश्वसनीय जवाब देने के लिए शोधकर्ताओं को स्वाभाविक रूप से होने वाले डेटा में सहसंबंधों से आगे बढ़ने में सक्षम बनाता है। एनालॉग युग में, प्रयोग अक्सर तर्कसंगत रूप से कठिन और महंगे होते थे। अब, डिजिटल युग में, तार्किक बाधा धीरे-धीरे खत्म हो रही है। अतीत में किए गए प्रयोगों को न केवल करना आसान है, अब नए प्रकार के प्रयोगों को चलाने के लिए संभव है।
जो मैंने अभी तक लिखा है, मैं अपनी भाषा में थोड़ा ढीला रहा हूं, लेकिन दो चीजों के बीच अंतर करना महत्वपूर्ण है: प्रयोग और यादृच्छिक नियंत्रित प्रयोग। एक प्रयोग में , एक शोधकर्ता दुनिया में हस्तक्षेप करता है और फिर परिणाम का आकलन करता है। मैंने इस दृष्टिकोण को "परेशान और निरीक्षण" के रूप में वर्णित किया है। एक यादृच्छिक नियंत्रित प्रयोग में एक शोधकर्ता कुछ लोगों के लिए हस्तक्षेप करता है, न कि दूसरों के लिए, और शोधकर्ता तय करता है कि कौन से लोगों को यादृच्छिकरण (जैसे, एक सिक्का फिसलने) द्वारा हस्तक्षेप प्राप्त होता है। यादृच्छिक नियंत्रित प्रयोग दो समूहों के बीच उचित तुलना बनाते हैं: जिसने हस्तक्षेप प्राप्त किया है और वह नहीं है। दूसरे शब्दों में, यादृच्छिक नियंत्रित प्रयोग confounders की समस्याओं का समाधान हैं। पर्टबर्ब-एंड-निरीक्षण प्रयोगों में, हालांकि, केवल एक ही समूह शामिल है जिसे हस्तक्षेप प्राप्त हुआ है, और इसलिए परिणाम शोधकर्ताओं को गलत निष्कर्ष तक ले जा सकते हैं (जैसा कि मैं जल्द ही दिखाऊंगा)। प्रयोगों और यादृच्छिक नियंत्रित प्रयोगों के बीच महत्वपूर्ण मतभेदों के बावजूद, सामाजिक शोधकर्ता अक्सर इन शर्तों का एक-दूसरे से उपयोग करते हैं। मैं इस सम्मेलन का पालन करूंगा, लेकिन, कुछ बिंदुओं पर, मैं यादृच्छिकता और नियंत्रण समूह के बिना प्रयोगों पर यादृच्छिक नियंत्रित प्रयोगों के मूल्य पर जोर देने के लिए सम्मेलन तोड़ दूंगा।
यादृच्छिक नियंत्रित प्रयोग सामाजिक दुनिया के बारे में जानने के लिए एक शक्तिशाली तरीका साबित हुए हैं, और इस अध्याय में, मैं आपको अपने शोध में उनका उपयोग करने के तरीके के बारे में और अधिक दिखाऊंगा। धारा 4.2 में, मैं विकिपीडिया पर एक प्रयोग के उदाहरण के साथ प्रयोग के मूल तर्क को चित्रित करूंगा। फिर, धारा 4.3 में, मैं प्रयोगशाला प्रयोगों और क्षेत्र प्रयोगों और एनालॉग प्रयोगों और डिजिटल प्रयोगों के बीच अंतर के बीच अंतर का वर्णन करूंगा। इसके अलावा, मैं तर्क दूंगा कि डिजिटल फ़ील्ड प्रयोग एनालॉग लैब प्रयोगों (कड़े नियंत्रण) और एनालॉग फ़ील्ड प्रयोगों (यथार्थवाद) की सर्वोत्तम विशेषताओं की पेशकश कर सकते हैं, सभी एक ऐसे पैमाने पर जो पहले संभव नहीं था। इसके बाद, सेक्शन 4.4 में, मैं तीन अवधारणाओं का सत्यापन करूंगा-वैधता, उपचार प्रभावों की विषमता, और तंत्र-जो अमीर प्रयोगों को डिजाइन करने के लिए महत्वपूर्ण हैं। उस पृष्ठभूमि के साथ, मैं डिजिटल प्रयोगों के संचालन के लिए दो मुख्य रणनीतियों में शामिल व्यापार-बंद का वर्णन करूंगा: इसे स्वयं कर रहा हूं या शक्तिशाली के साथ साझेदारी कर रहा हूं। अंत में, मैं कुछ प्रयोगों के बारे में सलाह दूंगा कि आप डिजिटल प्रयोगों (धारा 4.6.1) की वास्तविक शक्ति का लाभ कैसे उठा सकते हैं और उस शक्ति के साथ आने वाली कुछ ज़िम्मेदारी का वर्णन कर सकते हैं (धारा 4.6.2)।