2.4.3.1 प्राकृतिक प्रयोगों

प्राकृतिक प्रयोगों दुनिया में यादृच्छिक घटनाओं का लाभ ले। यादृच्छिक घटना + हमेशा पर डेटा सिस्टम = प्राकृतिक प्रयोग

यादृच्छिक नियंत्रित प्रयोगों निष्पक्ष तुलना को सक्षम करने के लिए महत्वपूर्ण यादृच्छिकीकरण है। हालांकि, कभी कभी कुछ ऐसी दुनिया है कि अनिवार्य रूप से अलग उपचार के लिए बेतरतीब ढंग से बेतरतीब ढंग से या लगभग लोगों प्रदान करती है में होता है। प्राकृतिक प्रयोगों का उपयोग करने की रणनीति का स्पष्ट उदाहरण में से एक के अनुसंधान से आता है Angrist (1990) है कि आय पर सैन्य सेवाओं के प्रभाव के उपाय।

वियतनाम में युद्ध के दौरान, संयुक्त राज्य अमेरिका के एक ड्राफ्ट के माध्यम से अपने सशस्त्र बलों के आकार में वृद्धि हुई। आदेश में तय करना है जो नागरिकों को सेवा में बुलाया जाएगा में, अमेरिकी सरकार एक लॉटरी का आयोजन किया। हर जन्मतिथि कागज के एक टुकड़े पर प्रतिनिधित्व किया था, और इन पत्रों के एक बड़े ग्लास जार में रखा गया था। जैसा कि चित्र में दिखाया गया है 2.5, कागज के इन निकल जाता है एक समय में एक जार से तैयार किया गया आदेश है कि युवा पुरुषों (युवा महिलाओं के मसौदे के अधीन नहीं थे) की सेवा करने के लिए बुलाया जाएगा निर्धारित करने के लिए। परिणामों के आधार पर 14 सितंबर को पैदा हुए पुरुषों पहले कहा जाता था, 24 अप्रैल को पैदा हुए पुरुषों दूसरे कहा जाता था, और इतने पर। अंततः, इस लॉटरी में, 195 अलग अलग दिनों पर पैदा हुए पुरुषों सेवा के लिए बुलाया गया है, जबकि 171 दिनों पर पैदा हुए पुरुषों नहीं बुलाया गया।

चित्रा 2.5: कांग्रेसी अलेक्जेंडर Pirnie (आर-एनवाई) 1 दिसंबर को सेलेक्टिव सर्विस मसौदे के लिए पहले कैप्सूल ड्राइंग, 1969 यहोशू Angrist (1990) संयुक्त सामाजिक सुरक्षा प्रशासन से आय डेटा के साथ मसौदा लॉटरी सैन्य सेवा के प्रभाव का आकलन करने के लिए आय पर। यह एक प्राकृतिक प्रयोग का उपयोग कर अनुसंधान का एक उदाहरण है। स्रोत: विकिपीडिया

चित्रा 2.5: कांग्रेसी अलेक्जेंडर Pirnie (आर-एनवाई) 1 दिसंबर को सेलेक्टिव सर्विस मसौदे के लिए पहले कैप्सूल ड्राइंग, 1969 यहोशू Angrist (1990) संयुक्त सामाजिक सुरक्षा प्रशासन से आय डेटा के साथ मसौदा लॉटरी सैन्य सेवा के प्रभाव का आकलन करने के लिए आय पर। यह एक प्राकृतिक प्रयोग का उपयोग कर अनुसंधान का एक उदाहरण है। स्रोत: विकिपीडिया

हालांकि यह तुरंत स्पष्ट नहीं हो सकता है, एक मसौदा लॉटरी एक यादृच्छिक नियंत्रित प्रयोग करने के लिए एक महत्वपूर्ण समानता है: दोनों स्थितियों में प्रतिभागियों को बेतरतीब ढंग से एक उपचार प्राप्त करने के लिए आवंटित कर रहे हैं। मसौदा लॉटरी के मामले में, अगर हम मसौदा पात्रता और बाद में श्रम बाजार की कमाई पर सैन्य सेवा के प्रभाव के बारे में सीखने में रुचि रखते हैं, हम लोगों को जिनके birthdates लॉटरी कटऑफ नीचे थे (के लिए परिणामों की तुलना कर सकते हैं जैसे, 14 सितंबर, अप्रैल 24, आदि) के लोगों को जिनके जन्मदिन कटऑफ के बाद किया गया है (जैसे, 20 फरवरी, 2 दिसंबर, आदि) के लिए परिणामों के साथ।

यह देखते हुए कि मसौदा तैयार किया जा रहा है की इस इलाज को बेतरतीब ढंग से आवंटित किया गया है, हम तो किसी भी परिणाम है कि मापा गया है के लिए इस इलाज के प्रभाव को मापने कर सकते हैं। उदाहरण के लिए, Angrist (1990) जो बेतरतीब ढंग से आय डेटा है कि सामाजिक सुरक्षा प्रशासन द्वारा एकत्र की गई थी निष्कर्ष है कि सफेद दिग्गजों की कमाई के बारे में 15% तुलनीय गैर दिग्गजों की आय की तुलना में कम थे के साथ मसौदे में चयनित किया गया था के बारे में जानकारी संयुक्त । अन्य शोधकर्ताओं ने एक समान चाल के रूप में अच्छी तरह से इस्तेमाल किया है। उदाहरण के लिए, Conley and Heerwig (2011) जो बेतरतीब ढंग से 2000 की जनगणना और 2005 के अमेरिकी समुदाय सर्वेक्षण से एकत्र घर के डेटा के साथ मसौदे में चयनित किया गया था के बारे में जानकारी संयुक्त और पाया कि इतने लंबे समय के मसौदे के बाद, वहाँ के छोटे से लंबी अवधि के प्रभाव था ऐसे आवास कार्यकाल (किराये पर लिया बनाम मालिक) और आवासीय स्थिरता (पिछले पांच साल में ले जाया होने की संभावना) के रूप में परिणामों की विविधता पर सैन्य सेवा।

इस उदाहरण के रूप में दिखाता है, कभी कभी, सामाजिक, राजनीतिक, या प्राकृतिक बलों प्रयोगों या पास-प्रयोगों है कि शोधकर्ताओं द्वारा उपयोग किया जा सकता बनाने के लिए। अक्सर प्राकृतिक प्रयोगों का सबसे अच्छा तरीका सेटिंग्स में कारण और प्रभाव संबंधों अनुमान लगाने के लिए जहां यह नैतिक या व्यावहारिक यादृच्छिक नियंत्रित प्रयोगों को चलाने के लिए नहीं है। वे गैर प्रयोगात्मक डेटा में निष्पक्ष तुलना की खोज के लिए एक महत्वपूर्ण रणनीति है। इस शोध रणनीति इस समीकरण से संक्षेप किया जा सकता है:

\ [\ पाठ {यादृच्छिक (या अगर यादृच्छिक रूप में) घटना} + \ पाठ {हमेशा पर डेटा स्ट्रीम} = \ पाठ {प्राकृतिक प्रयोग} \ qquad (2.1) \]

हालांकि, प्राकृतिक प्रयोगों के विश्लेषण काफी मुश्किल हो सकता है। उदाहरण के लिए, वियतनाम ड्राफ्ट के मामले में, हर कोई नहीं है जो मसौदा-पात्र की सेवा को समाप्त हो गया था (छूट की एक किस्म के थे)। और, एक ही समय में, कुछ लोग हैं जो मसौदा पात्र नहीं थे सेवा के लिए स्वेच्छा से। यह ऐसा ही था तो एक नई दवा की एक चिकित्सीय परीक्षण में, इलाज के समूह में कुछ लोग अपने दवा नहीं लेते हैं और था नियंत्रण समूह में से कुछ लोगों ने किसी भी तरह की दवा प्राप्त किया। यह समस्या है, दो-तरफा गैर अनुपालन कहा जाता है, साथ ही कई अन्य समस्याओं के इस अध्याय के अंत में सिफारिश की रीडिंग में से कुछ में अधिक से अधिक विस्तार में वर्णित हैं।

स्वाभाविक रूप से बिना सोचे समझे काम से होने वाली का लाभ लेने की रणनीति डिजिटल युग पछाड़ दिया है, लेकिन बड़ा डेटा की व्यापकता इस रणनीति बहुत आसान उपयोग करने के लिए बनाता है। एक बार जब आप का एहसास कुछ उपचार बेतरतीब ढंग से सौंपा गया है, बड़ा डेटा स्रोतों परिणाम डेटा है कि आप क्रम में उपचार और नियंत्रण की स्थिति में लोगों के लिए परिणामों की तुलना करने के लिए की जरूरत है प्रदान कर सकते हैं। उदाहरण के लिए, ड्राफ्ट और सैन्य सेवा के प्रभाव के अपने अध्ययन में, Angrist सामाजिक सुरक्षा प्रशासन से कमाई के रिकॉर्ड का इस्तेमाल किया; इस परिणाम के आंकड़ों के बिना, अपने अध्ययन संभव नहीं होता। इस मामले में, सामाजिक सुरक्षा प्रशासन हमेशा पर बड़ा डेटा स्रोत है। अधिक से अधिक स्वचालित रूप से एकत्र आंकड़ों के सूत्रों अस्तित्व के रूप में, हम और अधिक परिणाम है कि डेटा बहिर्जात भिन्नता द्वारा बनाई परिवर्तन के प्रभाव को मापने कर सकते हैं होगा।

डिजिटल युग में इस रणनीति का वर्णन है, चलो मास और Moretti का विचार करते हैं (2009) उत्पादकता पर साथियों के प्रभाव पर शोध सुरुचिपूर्ण। हालांकि सतह पर यह वियतनाम ड्राफ्ट के प्रभाव के बारे में Angrist के अध्ययन से अलग लग सकता है, संरचना में वे दोनों eq में पैटर्न का पालन करें। 2.1।

मास और Moretti मापा कैसे साथियों श्रमिकों की उत्पादकता प्रभावित करते हैं। एक तरफ, एक कठिन काम सहकर्मी होने साथियों के दबाव की वजह से उनकी उत्पादकता बढ़ाने के लिए कार्यकर्ताओं को जन्म दे सकता है। या, दूसरे हाथ पर, एक कठिन काम सहकर्मी अन्य कार्यकर्ताओं का नेतृत्व भी अधिक सुस्त करने के लिए हो सकता है। उत्पादकता पर साथियों के प्रभाव का अध्ययन करने के लिए स्पष्ट रास्ता एक यादृच्छिक नियंत्रित प्रयोग जहां कार्यकर्ताओं को बेतरतीब ढंग से अलग उत्पादकता के स्तर के कार्यकर्ताओं के साथ बदलाव करने के लिए आवंटित कर रहे हैं और फिर परिणामस्वरूप उत्पादकता हर किसी के लिए मापा जाता है होगा। शोधकर्ताओं ने हालांकि, किसी भी वास्तविक व्यापार में श्रमिकों की अनुसूची पर नियंत्रण नहीं है, और इसलिए मास और Moretti एक प्राकृतिक प्रयोग है जिसमें एक सुपरमार्केट में जगह ले ली पर निर्भर होना पड़ा।

बस EQ की तरह। 2.1, उनके अध्ययन दो भागों था। पहला, वे सुपरमार्केट जांच प्रणाली से लॉग इस्तेमाल एक सटीक, अलग-अलग है, और उत्पादकता के उपाय हमेशा पर: स्कैन प्रति सेकंड मदों की संख्या। और, दूसरी, क्योंकि जिस तरह से है कि समय निर्धारण इस सुपरमार्केट में किया गया था, वे साथियों के यादृच्छिक रचना के पास है। दूसरे शब्दों में, भले ही कैशियर का निर्धारण एक लॉटरी से निर्धारित नहीं है, यह अनिवार्य रूप से यादृच्छिक था। अभ्यास में, विश्वास है कि हम प्राकृतिक प्रयोगों में है इस बार "के रूप में यदि" यादृच्छिक दावे की दिखावट पर टिका है। इस यादृच्छिक विभिन्नता का लाभ उठाते हुए, मास और Moretti में पाया गया कि उच्च उत्पादकता साथियों के साथ काम करने की उत्पादकता बढ़ जाती है। इसके अलावा, मास और Moretti कारण और प्रभाव के आकलन से परे ले जाने के लिए दो और महत्वपूर्ण और सूक्ष्म मुद्दों का पता लगाने के लिए आकार और उनके डाटासेट की समृद्धि का इस्तेमाल किया: इस आशय (जिसके लिए श्रमिकों के प्रकार के प्रभाव बड़ा है) की विविधता और तंत्र प्रभाव के पीछे (क्यों उच्च उत्पादकता साथियों उच्च उत्पादकता के लिए नेतृत्व कर रहे है)। जब हम और अधिक विस्तार में प्रयोगों पर चर्चा हम उपचार के प्रभाव और तंत्र में 5 अध्याय के इन दो महत्वपूर्ण मुद्दों-विविधता के लिए वापस आ जाएगी।

आय और उत्पादकता पर साथियों के प्रभाव के अध्ययन पर वियतनाम ड्राफ्ट के प्रभाव पर अध्ययन से सामान्यीकरण, टेबल 2.3 अन्य अध्ययनों से इस सटीक एक ही संरचना है कि सार: एक हमेशा पर डेटा स्रोत किसी घटना के प्रभाव को मापने के लिए इस्तेमाल कर । तालिका 2.3 स्पष्ट करता है, प्राकृतिक प्रयोगों हर जगह अगर तुम सिर्फ उन्हें देखने के लिए कैसे जानते हैं।

तालिका 2.3: बड़ा डेटा स्रोतों का उपयोग प्राकृतिक प्रयोगों के उदाहरण हैं। यादृच्छिक (या के रूप में यदि यादृच्छिक) घटना + डाटा प्रणाली हमेशा पर: इन सभी अध्ययनों से एक ही मूल विधि का पालन करें। देखें Dunning (2012) अधिक उदाहरण के लिए।
मूल फोकस प्राकृतिक प्रयोग के स्रोत हमेशा पर डेटा स्रोत उद्धरण
उत्पादकता पर प्रभाव सहकर्मी समय निर्धारण की प्रक्रिया चेकआउट डेटा Mas and Moretti (2009)
मैत्री गठन तूफान फेसबुक Phan and Airoldi (2015)
भावनाओं के प्रसार बारिश फेसबुक Coviello et al. (2014)
आर्थिक स्थानान्तरण सहकर्मी सहकर्मी भूकंप मोबाइल मनी डेटा Blumenstock, Fafchamps, and Eagle (2011)
व्यक्तिगत खपत व्यवहार 2013 अमेरिका सरकार शटडाउन व्यक्तिगत वित्त डेटा Baker and Yannelis (2015)
recommender प्रणालियों के आर्थिक प्रभाव विभिन्न अमेज़न पर ब्राउज़िंग डेटा Sharma, Hofman, and Watts (2015)
अजन्मे शिशुओं पर तनाव का प्रभाव 2006 के इज़राइल-हिज़्बुल्ला युद्ध जन्म रिकॉर्ड Torche and Shwed (2015)
विकिपीडिया पर व्यवहार पढ़ना स्नोडेन के खुलासे विकिपीडिया लॉग Penney (2016)

अभ्यास में, शोधकर्ताओं प्राकृतिक प्रयोगों, जो दोनों के लिए उपयोगी हो सकते हैं खोजने के लिए दो अलग अलग रणनीतियों का उपयोग करें। कुछ शोधकर्ताओं का डेटा हमेशा पर स्रोत के साथ शुरू करते हैं और दुनिया में यादृच्छिक घटनाओं के लिए लग रही है; दूसरों को दुनिया में यादृच्छिक घटनाओं के साथ शुरू और डेटा स्रोत है कि उनके प्रभाव को पकड़ने के लिए लग रही है। अंत में, सूचना है कि प्राकृतिक प्रयोगों की ताकत सांख्यिकीय विश्लेषण का परिष्कार से नहीं आता है, लेकिन इतिहास के एक भाग्यशाली दुर्घटना के द्वारा बनाई गई एक निष्पक्ष तुलना की खोज में ख्याल से।