मिलान टाढा अवस्थामा छाँट्ने द्वारा निष्पक्ष तुलना सिर्जना गर्नुहोस्।
उचित तुलना नियन्त्रण बेतरतीब प्रयोगहरू वा प्राकृतिक प्रयोगहरू या त देखि आउन सक्नुहुन्छ। तर, त्यहाँ तपाईं आदर्श प्रयोग चल्दैन कहाँ र गर्न सक्छन् प्रकृति प्राकृतिक प्रयोग प्रदान गरिएको छैन धेरै अवस्थामा छन्। यी सेटिङहरू मा, एक निष्पक्ष तुलना मिल्ने छ सिर्जना गर्न सबै भन्दा राम्रो तरिका हो। मिल्दो मा, शोधकर्ता एक उपचार प्राप्त गरेको छ बाहेक समान छन् भन्ने मान्छे को जोडी सिर्जना गर्न गैर-प्रयोगात्मक डाटा मार्फत देखिन्छ र एक छैन। मिल्दो को प्रक्रिया मा, अनुसन्धानकर्ताहरूले वास्तवमा पनि छाँट्ने छन्; कि अवस्थामा जहाँ कुनै स्पष्ट तुलना छन् खारेज छ। तसर्थ, यो विधि अधिक सही मिल्दो-र-छाँट्ने भनिन्छ हुनेछ, तर म परम्परागत अवधि संग रहन छौँ: मिलान।
विशाल गैर-प्रयोगात्मक डाटा स्रोतहरु संग रणनीति मिल्ने शक्ति एक सुन्दर उदाहरण Liran Einav र सहकर्मीहरुको उपभोक्ता व्यवहार मा अनुसन्धान बाट आएको (2015) । Einav र सहयोगिहरु मा eBay भइरहेको नीलामी रुचि थिए, र आफ्नो काम वर्णन मा, म एक विशेष पक्ष ध्यान केन्द्रित छौँ: यस्तो बिक्री मूल्य वा बिक्री को सम्भावना रूपमा लिलामी परिणाम, मा लिलामी सुरु मूल्य को प्रभाव।
बिक्री मूल्य मा सुरूवात मूल्य को प्रभाव बारेमा प्रश्नको जवाफ सबैभन्दा अनुभवहीन तरिका बस फरक सुरूवात मूल्यहरु संग नीलामी लागि अन्तिम मूल्य गणना गर्न हुनेछ। तपाईं बस दिइएको सुरूवात मूल्य eBay मा राख्नु भएको थियो भनेर दिइएको वस्तुको बिक्री मूल्य भविष्यवाणी गर्न चाहनुहुन्छ भने यो दृष्टिकोण राम्रो हुनेछ। तर, आफ्नो प्रश्न बजार परिणाम मा मूल्य सुरु यो दृष्टिकोण किनभने यो उचित तुलना मा आधारित छैन काम छैन प्रभाव के छ भने; कम सुरूवात मूल्यहरु संग नीलामी एकदम उच्च सुरूवात मूल्यहरु (जस्तै, तिनीहरूले सामान विभिन्न प्रकारका लागि हुन या विक्रेता विभिन्न प्रकारका समावेश हुन सक्छ) सँग नीलामी फरक हुन सक्छ।
तपाईं निष्पक्ष तुलना बनाउने बारे पहिले नै चिन्तित हुनुहुन्छ भने, तपाईं अनुभवहीन दृष्टिकोण छोड्न र एक क्षेत्र प्रयोग तपाईं लिलामी एक स्थिर सेट संग क्लब-खास वस्तु-भन्न बेच्न थियो जहाँ एक गोल्फ चलिरहेको विचार गर्न सक्छन् मापदण्डहरु-भन्छन्, निःशुल्क ढुवानी, लिलामी दुई हप्ता लागि खुला आदि-तर अनियमित सुरु मूल्यहरु सेट संग। परिणामस्वरूप बजार परिणाम तुलना गरेर, यो क्षेत्र प्रयोग बिक्री मूल्य मा मूल्य सुरु प्रभाव को एक धेरै स्पष्ट मापन प्रस्ताव थियो। तर, यो मापन मात्र एक विशेष उत्पादन लागू र लिलामी मापदण्डहरु को सेट थियो। परिणाम उत्पादनहरु को विभिन्न प्रकार को लागि, उदाहरणका लागि, फरक हुन सक्छ। बिना बलियो सिद्धान्त, यो एकल प्रयोग सम्भव प्रयोगहरू को पूर्ण सीमा चलान गरिएका सक्ने देखि extrapolate गर्न गाह्रो छ। यसबाहेक, क्षेत्र प्रयोगहरू यो उत्पादन र लिलामी प्रकार को सम्पूर्ण मापदण्ड ठाउँ कवर सम्म तिनीहरूलाई पर्याप्त चलान infeasible भनेर पर्याप्त महंगा छन्।
को अनुभवहीन दृष्टिकोण र प्रयोगात्मक दृष्टिकोण गर्न यसको विपरीत, Einav र सहयोगिहरु तेस्रो दृष्टिकोण: मिलान। आफ्नो रणनीति को मुख्य चाल eBay मा पहिले नै भयो छन् क्षेत्रमा प्रयोगहरू गर्न पनि त्यस्तै पत्ता लगाउन छ। उदाहरणका लागि, चित्रा 2.6 बिल्कुल नै गल्फ क्लब-एक Taylormade बर्नर 09 चालक-भइरहेको द्वारा बिल्कुल नै seller- "budgetgolfer" बेचिएको लागि 31 सूचीकरण केही देखाउँछ। तर, यी सूचीहरू अलि फरक विशेषताहरु छ। जबकि अन्य 20 विभिन्न अन्त मिति संग नीलामी छन् तिनीहरूलाई को एघार, $ 124,99 को एक निश्चित मूल्य लागि चालक प्रस्ताव। साथै, सूचीकरण विभिन्न ढुवानी शुल्क छ, या त $ 7.99 वा $ 9.99। अर्को शब्दमा, यो "budgetgolfer" शोधकर्ताओं लागि प्रयोगहरू चलिरहेको छ भने छ।
को Taylormade बर्नर 09 चालक को सूची "budgetgolfer" द्वारा बिक्री भइरहेको जहाँ ठीक त्यसै वस्तु नै सटीक विक्रेता द्वारा बिक्री भइरहेको छ सूचीहरु, एक मिलान सेट तर अलि फरक विशेषताहरु संग प्रत्येक समय को एक उदाहरण हो। eBay को विशाल लग भित्र त्यहाँ शाब्दिक सूचीकरण लाखौं मुछिएको मेल खाने सेट हजारौं छन्। तसर्थ, बरु दिइएको सुरूवात मूल्य भित्र सबै नीलामी लागि अन्तिम मूल्य तुलना भन्दा, Einav र सहयोगिहरु मेल खाने सेट भित्र तुलना बनाउन। यी मिलान सेट हजारौं भित्र तुलना परिणाम संयोजन गर्न, Einav र सहयोगिहरु प्रत्येक वस्तु (जस्तै, यसको औसत बिक्री मूल्य) को सन्दर्भ मूल्य को मामला मा सुरु मूल्य र अन्तिम मूल्य पुन व्यक्त। उदाहरणका लागि, Taylormade बर्नर 09 चालक $ 100 को एक सन्दर्भ मूल्य छ भने (यसको बिक्री आधारित), त्यसपछि $ 10 को एक सुरूवात मूल्य 0.1 रूपमा व्यक्त हुने र $ 120 को अन्तिम मूल्य 1.2 रूपमा व्यक्त हुनेछ।
Einav र सहयोगिहरु लिलामी परिणाम मा सुरु मूल्य को प्रभाव रुचि थिए सम्झनुहोस्। पहिलो, रैखिक प्रतिगमनमा प्रयोग तिनीहरूले उच्च सुरूवात मूल्य एक बिक्री को सम्भावना कम, र उच्च सुरूवात मूल्यहरु अन्तिम बिक्री मूल्य, एक बिक्री निरन्तर मा ससर्त वृद्धि गर्ने अनुमान। आफूलाई गरेर, यी अनुमान-जो सबै उत्पादनहरु भन्दा औसत छन् र सुरूवात मूल्य र अन्तिम बीच एक रैखिक सम्बन्ध मान सबै कि रोचक छैन परिणाम-छन्। तर, Einav र सहयोगिहरु पनि थप सूक्ष्म निष्कर्ष विभिन्न अनुमान गर्न आफ्नो डाटा को विशाल आकार प्रयोग गर्नुहोस्। पहिलो, Einav र सहयोगिहरु फरक मूल्य को आइटम लागि र रैखिक प्रतिगमनमा प्रयोग बिना अलग यी अनुमान गरे। तिनीहरू बिक्री सुरुवात मूल्य र सम्भावना बीचको सम्बन्ध रैखिक हुँदा, सुरूवात मूल्य र बिक्री मूल्य बीचको सम्बन्ध स्पष्ट गैर-रैखिक (चित्रा 2.7) छ कि पाइएन। खासगरी, 0.05 र 0.85 बीच मूल्यहरु सुरु लागि, सुरु मूल्य बिक्री मूल्य, एक रैखिक सम्बन्ध ग्रहण गरेको विश्लेषण मा छुटेका पूरा भएको थियो कि एक खोजन मा धेरै सानो प्रभाव छ।
दोस्रो, बरु सबै वस्तुहरू अधिक averaging भन्दा, Einav र सहयोगिहरु पनि आफ्नो डाटा को विशाल मात्रा वस्तुहरू (जस्तै, पाल्तु जनावर आपूर्ति, इलेक्ट्रनिक्स, र खेल सम्झना) (चित्रा 2.8) को 23 विभिन्न विभाग लागि सुरु मूल्य को प्रभाव अनुमान गर्न प्रयोग गर्नुहोस्। यी अनुमान थप विशिष्ट लागि आइटम-जस्तै स्मरणीय-सुरु मूल्य एक बिक्री को सम्भावना र अन्तिम बिक्री मूल्य मा एक ठूलो प्रभाव सानो प्रभाव छ भनेर देखाउँछ। यसबाहेक, लागि थप commodified वस्तुहरू-यस्तो डीभिडी र भिडियो-सुरु मूल्य रूपमा अन्तिम मूल्य मा लगभग कुनै प्रभाव छ। अर्को शब्दमा, वस्तुहरूको 23 विभिन्न विभाग परिणाम जोडती एउटा औसत यी वस्तुहरू बीच मतभेद बारेमा महत्वपूर्ण जानकारी लुकाउँछ।
तपाईं eBay नीलामी मा विशेष रुचि छैन भने पनि, तपाईं 2.7 लिनुहोस् र 2.8 प्रस्ताव रैखिक सम्बन्ध मान र वस्तुहरूको विभिन्न विभाग संयोजन भनेर सरल रैखिक प्रतिगमनमा अनुमान भन्दा eBay को एक धनी समझ लिनुहोस् भनेर बाटो पराउँछु छ। यी थप सूक्ष्म अनुमान विशाल डाटा मा मिल्दो शक्ति चित्रण; यी अनुमान एक भारी prohibitively महंगा भएको थियो जो, क्षेत्र प्रयोगहरू संख्या बिना असम्भव भएको थियो।
निस्सन्देह, हामी एक तुलना प्रयोग को परिणाम मा हुनेछ भन्दा कुनै पनि विशेष मिल्दो अध्ययन को परिणाम मा कम भरोसा गर्नुपर्छ। कुनै पनि मिल्ने अध्ययन देखि परिणाम आकलन गर्दा दुई महत्त्वपूर्ण चिन्ता छन्। पहिलो, हामी मिलानका लागि प्रयोग गरिएको थियो भन्ने कुरामा उचित तुलना मात्र सुनिश्चित गर्न सक्छन् कि सम्झना छ। विक्रेता आईडी नम्बर, वस्तु वर्ग, वस्तु शीर्षक, र उपशीर्षक: आफ्नो मुख्य परिणाममा, Einav र सहयोगिहरु सही मा चार विशेषताहरु मिल्ने थिएन। आइटम अन्यायपूर्ण तुलना सिर्जना सक्ने मिलानका लागि प्रयोग गर्न थिए तरिका, विभिन्न थिए भने। उदाहरणका लागि, यदि "budgetgolfer" Taylormade बर्नर 09 चालक लागि मूल्यहरु हिउँदमा कम (गल्फ क्लबको कम लोकप्रिय हुँदा), त्यसपछि यसलाई कम सुरूवात मूल्यहरु अन्तिम मूल्य कम नेतृत्व, वास्तवमा यो मौसमी को एक शिल्पकृति हुनेछ जब देखा सक्छ मांग मा विविधता। सामान्य मा, यो समस्या सबै भन्दा राम्रो दृष्टिकोण मिल्ने विभिन्न प्रकारका प्रयास देखिन्छ। उदाहरणका लागि, Einav र सहयोगिहरु आफ्नो विश्लेषण जहाँ मेल खाने सेट एक महिना भित्र एक वर्ष भित्र बिक्री मा आइटम, र contemporaneously समावेश दोहोर्याउनुहोस्। समय विन्डो तंग बनाउने मेल खाने सेट संख्या घट्छ, तर मौसमी विविधता बारेमा चिन्ता कम गर्छ। खुसीको कुरा, तिनीहरूले परिणाम मिल्ने मापदण्ड यी परिवर्तनहरू द्वारा अपरिवर्तित हो कि पाउँछौं। मेल खाने साहित्य मा, चासो यस प्रकारको सामान्यतया observables र unobservables मामलामा व्यक्त गरिएको छ, तर प्रमुख विचार अनुसन्धानकर्ताहरूले मात्र मिल्ने प्रयोग सुविधाहरुको निष्पक्ष तुलना सिर्जना गर्दै साँच्चै भन्ने हो।
मिल्ने परिणाम व्याख्या गर्दा दोस्रो प्रमुख चासो तिनीहरूले मात्र मिलान डाटा लागू छ; तिनीहरूले मेल खाने छैन सकिएन भन्ने अवस्थामा लागू छैन। उदाहरणका लागि, वस्तुहरू धेरै सूचीकरण Einav र सहयोगिहरु व्यावसायिक र अर्ध-व्यावसायिक विक्रेता ध्यान छन् थियो कि आफ्नो अनुसन्धान सीमित द्वारा। तसर्थ, यी तुलना व्याख्या गर्दा हामी तिनीहरूले मात्र eBay यस उपसमूह लागू गर्ने सम्झनै पर्छ।
मिलान ठूलो डेटासेट उचित तुलना फेला लागि एक शक्तिशाली रणनीति हो। धेरै सामाजिक वैज्ञानिकहरूले गर्न, मिलान प्रयोगहरू गर्न दोस्रो सबै भन्दा राम्रो जस्तै महसुस तर अलिकति संशोधित गर्न, गर्नुपर्छ भनेर एक विश्वास छ। 1) को प्रभाव मा heterogeneity महत्त्वपूर्ण छ र 2) मिलानका लागि राम्रो observables छन्: जब विशाल डाटा मा मिल्दो क्षेत्र प्रयोगहरू एउटा सानो संख्या भन्दा राम्रो हुन सक्छ। तालिका 2.4 मिल्ने कति ठूलो डाटा स्रोतहरु संग प्रयोग गर्न सकिन्छ केही अन्य उदाहरण प्रदान गर्दछ।
ठोस ध्यान | ठूलो डेटा स्रोत | उद्धरण |
---|---|---|
प्रहरी हिंसा मा shootings को प्रभाव | रेकर्ड-र-frisk रोक्न | Legewie (2016) |
परिवार र छिमेकी मा सेप्टेम्बर 11, 2001 को प्रभाव | मतदान रेकर्ड र दान रेकर्ड | Hersh (2013) |
सामाजिक contagion | संचार र उत्पादन ग्रहण डाटा | Aral, Muchnik, and Sundararajan (2009) |
निष्कर्ष मा, गैर-प्रयोगात्मक डाटा देखि causal प्रभाव अनुमान गर्न अनुभवहीन दृष्टिकोण खतरनाक छन्। तर, बलियो देखि weakest एक Continuum साथ झूट causal अनुमान बनाउन लागि रणनीति र अनुसन्धानकर्ताहरूले गैर-प्रयोगात्मक डाटा भित्र निष्पक्ष तुलना पत्ता लगाउन सक्नुहुन्छ। प्राकृतिक प्रयोगहरू र मिलान: सधैं-, ठूलो डाटा प्रणाली को विकास प्रभावकारी दुई अवस्थित विधिहरू प्रयोग गर्न हाम्रो क्षमता बढ्छ।