2.4.3.2 मिलान

मिलान टाढा अवस्थामा छाँट्ने द्वारा निष्पक्ष तुलना सिर्जना गर्नुहोस्।

उचित तुलना नियन्त्रण बेतरतीब प्रयोगहरू वा प्राकृतिक प्रयोगहरू या त देखि आउन सक्नुहुन्छ। तर, त्यहाँ तपाईं आदर्श प्रयोग चल्दैन कहाँ र गर्न सक्छन् प्रकृति प्राकृतिक प्रयोग प्रदान गरिएको छैन धेरै अवस्थामा छन्। यी सेटिङहरू मा, एक निष्पक्ष तुलना मिल्ने छ सिर्जना गर्न सबै भन्दा राम्रो तरिका हो। मिल्दो मा, शोधकर्ता एक उपचार प्राप्त गरेको छ बाहेक समान छन् भन्ने मान्छे को जोडी सिर्जना गर्न गैर-प्रयोगात्मक डाटा मार्फत देखिन्छ र एक छैन। मिल्दो को प्रक्रिया मा, अनुसन्धानकर्ताहरूले वास्तवमा पनि छाँट्ने छन्; कि अवस्थामा जहाँ कुनै स्पष्ट तुलना छन् खारेज छ। तसर्थ, यो विधि अधिक सही मिल्दो-र-छाँट्ने भनिन्छ हुनेछ, तर म परम्परागत अवधि संग रहन छौँ: मिलान।

विशाल गैर-प्रयोगात्मक डाटा स्रोतहरु संग रणनीति मिल्ने शक्ति एक सुन्दर उदाहरण Liran Einav र सहकर्मीहरुको उपभोक्ता व्यवहार मा अनुसन्धान बाट आएको (2015) । Einav र सहयोगिहरु मा eBay भइरहेको नीलामी रुचि थिए, र आफ्नो काम वर्णन मा, म एक विशेष पक्ष ध्यान केन्द्रित छौँ: यस्तो बिक्री मूल्य वा बिक्री को सम्भावना रूपमा लिलामी परिणाम, मा लिलामी सुरु मूल्य को प्रभाव।

बिक्री मूल्य मा सुरूवात मूल्य को प्रभाव बारेमा प्रश्नको जवाफ सबैभन्दा अनुभवहीन तरिका बस फरक सुरूवात मूल्यहरु संग नीलामी लागि अन्तिम मूल्य गणना गर्न हुनेछ। तपाईं बस दिइएको सुरूवात मूल्य eBay मा राख्नु भएको थियो भनेर दिइएको वस्तुको बिक्री मूल्य भविष्यवाणी गर्न चाहनुहुन्छ भने यो दृष्टिकोण राम्रो हुनेछ। तर, आफ्नो प्रश्न बजार परिणाम मा मूल्य सुरु यो दृष्टिकोण किनभने यो उचित तुलना मा आधारित छैन काम छैन प्रभाव के छ भने; कम सुरूवात मूल्यहरु संग नीलामी एकदम उच्च सुरूवात मूल्यहरु (जस्तै, तिनीहरूले सामान विभिन्न प्रकारका लागि हुन या विक्रेता विभिन्न प्रकारका समावेश हुन सक्छ) सँग नीलामी फरक हुन सक्छ।

तपाईं निष्पक्ष तुलना बनाउने बारे पहिले नै चिन्तित हुनुहुन्छ भने, तपाईं अनुभवहीन दृष्टिकोण छोड्न र एक क्षेत्र प्रयोग तपाईं लिलामी एक स्थिर सेट संग क्लब-खास वस्तु-भन्न बेच्न थियो जहाँ एक गोल्फ चलिरहेको विचार गर्न सक्छन् मापदण्डहरु-भन्छन्, निःशुल्क ढुवानी, लिलामी दुई हप्ता लागि खुला आदि-तर अनियमित सुरु मूल्यहरु सेट संग। परिणामस्वरूप बजार परिणाम तुलना गरेर, यो क्षेत्र प्रयोग बिक्री मूल्य मा मूल्य सुरु प्रभाव को एक धेरै स्पष्ट मापन प्रस्ताव थियो। तर, यो मापन मात्र एक विशेष उत्पादन लागू र लिलामी मापदण्डहरु को सेट थियो। परिणाम उत्पादनहरु को विभिन्न प्रकार को लागि, उदाहरणका लागि, फरक हुन सक्छ। बिना बलियो सिद्धान्त, यो एकल प्रयोग सम्भव प्रयोगहरू को पूर्ण सीमा चलान गरिएका सक्ने देखि extrapolate गर्न गाह्रो छ। यसबाहेक, क्षेत्र प्रयोगहरू यो उत्पादन र लिलामी प्रकार को सम्पूर्ण मापदण्ड ठाउँ कवर सम्म तिनीहरूलाई पर्याप्त चलान infeasible भनेर पर्याप्त महंगा छन्।

को अनुभवहीन दृष्टिकोण र प्रयोगात्मक दृष्टिकोण गर्न यसको विपरीत, Einav र सहयोगिहरु तेस्रो दृष्टिकोण: मिलान। आफ्नो रणनीति को मुख्य चाल eBay मा पहिले नै भयो छन् क्षेत्रमा प्रयोगहरू गर्न पनि त्यस्तै पत्ता लगाउन छ। उदाहरणका लागि, चित्रा 2.6 बिल्कुल नै गल्फ क्लब-एक Taylormade बर्नर 09 चालक-भइरहेको द्वारा बिल्कुल नै seller- "budgetgolfer" बेचिएको लागि 31 सूचीकरण केही देखाउँछ। तर, यी सूचीहरू अलि फरक विशेषताहरु छ। जबकि अन्य 20 विभिन्न अन्त मिति संग नीलामी छन् तिनीहरूलाई को एघार, $ 124,99 को एक निश्चित मूल्य लागि चालक प्रस्ताव। साथै, सूचीकरण विभिन्न ढुवानी शुल्क छ, या त $ 7.99 वा $ 9.99। अर्को शब्दमा, यो "budgetgolfer" शोधकर्ताओं लागि प्रयोगहरू चलिरहेको छ भने छ।

को Taylormade बर्नर 09 चालक को सूची "budgetgolfer" द्वारा बिक्री भइरहेको जहाँ ठीक त्यसै वस्तु नै सटीक विक्रेता द्वारा बिक्री भइरहेको छ सूचीहरु, एक मिलान सेट तर अलि फरक विशेषताहरु संग प्रत्येक समय को एक उदाहरण हो। eBay को विशाल लग भित्र त्यहाँ शाब्दिक सूचीकरण लाखौं मुछिएको मेल खाने सेट हजारौं छन्। तसर्थ, बरु दिइएको सुरूवात मूल्य भित्र सबै नीलामी लागि अन्तिम मूल्य तुलना भन्दा, Einav र सहयोगिहरु मेल खाने सेट भित्र तुलना बनाउन। यी मिलान सेट हजारौं भित्र तुलना परिणाम संयोजन गर्न, Einav र सहयोगिहरु प्रत्येक वस्तु (जस्तै, यसको औसत बिक्री मूल्य) को सन्दर्भ मूल्य को मामला मा सुरु मूल्य र अन्तिम मूल्य पुन व्यक्त। उदाहरणका लागि, Taylormade बर्नर 09 चालक $ 100 को एक सन्दर्भ मूल्य छ भने (यसको बिक्री आधारित), त्यसपछि $ 10 को एक सुरूवात मूल्य 0.1 रूपमा व्यक्त हुने र $ 120 को अन्तिम मूल्य 1.2 रूपमा व्यक्त हुनेछ।

चित्रा 2.6: एक मिलान सेट को एउटा उदाहरण। यो सही नै गल्फ नै सटीक व्यक्ति (budgetgolfer) द्वारा बिक्री भइरहेको क्लब (एक Taylormade बर्नर 09 चालक) छ, तर यी बिक्री केही फरक अवस्था (जस्तै, विभिन्न सुरूवात मूल्य) प्रदर्शन गरेका थिए। चित्रा Einav एट अल लिइएका। (2015)।

चित्रा 2.6: एक मिलान सेट को एउटा उदाहरण। यो सही नै गल्फ नै सटीक व्यक्ति ( "budgetgolfer") द्वारा बिक्री भइरहेको क्लब (एक Taylormade बर्नर 09 चालक) छ, तर यी बिक्री केही फरक अवस्था (जस्तै, विभिन्न सुरूवात मूल्य) प्रदर्शन गरेका थिए। चित्रा लिइएका Einav et al. (2015)

Einav र सहयोगिहरु लिलामी परिणाम मा सुरु मूल्य को प्रभाव रुचि थिए सम्झनुहोस्। पहिलो, रैखिक प्रतिगमनमा प्रयोग तिनीहरूले उच्च सुरूवात मूल्य एक बिक्री को सम्भावना कम, र उच्च सुरूवात मूल्यहरु अन्तिम बिक्री मूल्य, एक बिक्री निरन्तर मा ससर्त वृद्धि गर्ने अनुमान। आफूलाई गरेर, यी अनुमान-जो सबै उत्पादनहरु भन्दा औसत छन् र सुरूवात मूल्य र अन्तिम बीच एक रैखिक सम्बन्ध मान सबै कि रोचक छैन परिणाम-छन्। तर, Einav र सहयोगिहरु पनि थप सूक्ष्म निष्कर्ष विभिन्न अनुमान गर्न आफ्नो डाटा को विशाल आकार प्रयोग गर्नुहोस्। पहिलो, Einav र सहयोगिहरु फरक मूल्य को आइटम लागि र रैखिक प्रतिगमनमा प्रयोग बिना अलग यी अनुमान गरे। तिनीहरू बिक्री सुरुवात मूल्य र सम्भावना बीचको सम्बन्ध रैखिक हुँदा, सुरूवात मूल्य र बिक्री मूल्य बीचको सम्बन्ध स्पष्ट गैर-रैखिक (चित्रा 2.7) छ कि पाइएन। खासगरी, 0.05 र 0.85 बीच मूल्यहरु सुरु लागि, सुरु मूल्य बिक्री मूल्य, एक रैखिक सम्बन्ध ग्रहण गरेको विश्लेषण मा छुटेका पूरा भएको थियो कि एक खोजन मा धेरै सानो प्रभाव छ।

एक बिक्री (बायाँ प्यानल) र बिक्री मूल्य (दायाँ प्यानल) को लिलामी सुरु मूल्य र सम्भावना बीच सम्बन्ध: आंकडा 2.7। सुरु मूल्य र बिक्री को सम्भावना बीच एक रैखिक सम्बन्ध लगभग छ, तर त्यहाँ सुरु मूल्य र बिक्री मूल्य बीचको गैर-रैखिक सम्बन्ध छ; 0.05 र 0.85 बीच मूल्यहरु सुरु लागि, सुरु मूल्य बिक्री मूल्य मा धेरै सानो प्रभाव छ। दुवै अवस्थामा, यो सम्बन्ध वस्तु मूल्य को मूलतः स्वतन्त्र छन्। यी रेखांकन नेभाराको 4a र 4 बी एट Einav अल उर्तानु। (2015)।

एक बिक्री (बायाँ प्यानल) र बिक्री मूल्य (दायाँ प्यानल) को लिलामी सुरु मूल्य र सम्भावना बीच सम्बन्ध: आंकडा 2.7। सुरु मूल्य र बिक्री को सम्भावना बीच एक रैखिक सम्बन्ध लगभग छ, तर त्यहाँ सुरु मूल्य र बिक्री मूल्य बीचको गैर-रैखिक सम्बन्ध छ; 0.05 र 0.85 बीच मूल्यहरु सुरु लागि, सुरु मूल्य बिक्री मूल्य मा धेरै सानो प्रभाव छ। दुवै अवस्थामा, यो सम्बन्ध वस्तु मूल्य को मूलतः स्वतन्त्र छन्। यी रेखांकन नेभाराको 4a र 4 बी उर्तानु Einav et al. (2015)

दोस्रो, बरु सबै वस्तुहरू अधिक averaging भन्दा, Einav र सहयोगिहरु पनि आफ्नो डाटा को विशाल मात्रा वस्तुहरू (जस्तै, पाल्तु जनावर आपूर्ति, इलेक्ट्रनिक्स, र खेल सम्झना) (चित्रा 2.8) को 23 विभिन्न विभाग लागि सुरु मूल्य को प्रभाव अनुमान गर्न प्रयोग गर्नुहोस्। यी अनुमान थप विशिष्ट लागि आइटम-जस्तै स्मरणीय-सुरु मूल्य एक बिक्री को सम्भावना र अन्तिम बिक्री मूल्य मा एक ठूलो प्रभाव सानो प्रभाव छ भनेर देखाउँछ। यसबाहेक, लागि थप commodified वस्तुहरू-यस्तो डीभिडी र भिडियो-सुरु मूल्य रूपमा अन्तिम मूल्य मा लगभग कुनै प्रभाव छ। अर्को शब्दमा, वस्तुहरूको 23 विभिन्न विभाग परिणाम जोडती एउटा औसत यी वस्तुहरू बीच मतभेद बारेमा महत्वपूर्ण जानकारी लुकाउँछ।

आंकडा 2.8: परिणाम व्यक्तिगत प्रत्येक श्रेणी देखि अनुमान देखाए; सबै विभाग लागि अनुमान मा ठोस डट, सँगै pooled तालिका 11 (Einav एट अल। 2015, टेबल 11)। यी अनुमान थप विशिष्ट लागि आइटम-जस्तै स्मरणीय-सुरु मूल्य एक बिक्री (X-अक्ष) र अन्तिम बिक्री मूल्य (वाई-अक्ष) मा ठूलो प्रभाव को सम्भावना सानो प्रभाव छ भनेर देखाउँछ।

आंकडा 2.8: परिणाम व्यक्तिगत प्रत्येक श्रेणी देखि अनुमान देखाए; सँगै pooled सबै विभाग लागि अनुमान मा ठोस डट (Einav et al. 2015, Table 11) । यी अनुमान थप विशिष्ट लागि आइटम-जस्तै स्मरणीय-सुरु मूल्य एक बिक्री (X-अक्ष) र अन्तिम बिक्री मूल्य (वाई-अक्ष) मा ठूलो प्रभाव को सम्भावना सानो प्रभाव छ भनेर देखाउँछ।

तपाईं eBay नीलामी मा विशेष रुचि छैन भने पनि, तपाईं 2.7 लिनुहोस् र 2.8 प्रस्ताव रैखिक सम्बन्ध मान र वस्तुहरूको विभिन्न विभाग संयोजन भनेर सरल रैखिक प्रतिगमनमा अनुमान भन्दा eBay को एक धनी समझ लिनुहोस् भनेर बाटो पराउँछु छ। यी थप सूक्ष्म अनुमान विशाल डाटा मा मिल्दो शक्ति चित्रण; यी अनुमान एक भारी prohibitively महंगा भएको थियो जो, क्षेत्र प्रयोगहरू संख्या बिना असम्भव भएको थियो।

निस्सन्देह, हामी एक तुलना प्रयोग को परिणाम मा हुनेछ भन्दा कुनै पनि विशेष मिल्दो अध्ययन को परिणाम मा कम भरोसा गर्नुपर्छ। कुनै पनि मिल्ने अध्ययन देखि परिणाम आकलन गर्दा दुई महत्त्वपूर्ण चिन्ता छन्। पहिलो, हामी मिलानका लागि प्रयोग गरिएको थियो भन्ने कुरामा उचित तुलना मात्र सुनिश्चित गर्न सक्छन् कि सम्झना छ। विक्रेता आईडी नम्बर, वस्तु वर्ग, वस्तु शीर्षक, र उपशीर्षक: आफ्नो मुख्य परिणाममा, Einav र सहयोगिहरु सही मा चार विशेषताहरु मिल्ने थिएन। आइटम अन्यायपूर्ण तुलना सिर्जना सक्ने मिलानका लागि प्रयोग गर्न थिए तरिका, विभिन्न थिए भने। उदाहरणका लागि, यदि "budgetgolfer" Taylormade बर्नर 09 चालक लागि मूल्यहरु हिउँदमा कम (गल्फ क्लबको कम लोकप्रिय हुँदा), ​​त्यसपछि यसलाई कम सुरूवात मूल्यहरु अन्तिम मूल्य कम नेतृत्व, वास्तवमा यो मौसमी को एक शिल्पकृति हुनेछ जब देखा सक्छ मांग मा विविधता। सामान्य मा, यो समस्या सबै भन्दा राम्रो दृष्टिकोण मिल्ने विभिन्न प्रकारका प्रयास देखिन्छ। उदाहरणका लागि, Einav र सहयोगिहरु आफ्नो विश्लेषण जहाँ मेल खाने सेट एक महिना भित्र एक वर्ष भित्र बिक्री मा आइटम, र contemporaneously समावेश दोहोर्याउनुहोस्। समय विन्डो तंग बनाउने मेल खाने सेट संख्या घट्छ, तर मौसमी विविधता बारेमा चिन्ता कम गर्छ। खुसीको कुरा, तिनीहरूले परिणाम मिल्ने मापदण्ड यी परिवर्तनहरू द्वारा अपरिवर्तित हो कि पाउँछौं। मेल खाने साहित्य मा, चासो यस प्रकारको सामान्यतया observablesunobservables मामलामा व्यक्त गरिएको छ, तर प्रमुख विचार अनुसन्धानकर्ताहरूले मात्र मिल्ने प्रयोग सुविधाहरुको निष्पक्ष तुलना सिर्जना गर्दै साँच्चै भन्ने हो।

मिल्ने परिणाम व्याख्या गर्दा दोस्रो प्रमुख चासो तिनीहरूले मात्र मिलान डाटा लागू छ; तिनीहरूले मेल खाने छैन सकिएन भन्ने अवस्थामा लागू छैन। उदाहरणका लागि, वस्तुहरू धेरै सूचीकरण Einav र सहयोगिहरु व्यावसायिक र अर्ध-व्यावसायिक विक्रेता ध्यान छन् थियो कि आफ्नो अनुसन्धान सीमित द्वारा। तसर्थ, यी तुलना व्याख्या गर्दा हामी तिनीहरूले मात्र eBay यस उपसमूह लागू गर्ने सम्झनै पर्छ।

मिलान ठूलो डेटासेट उचित तुलना फेला लागि एक शक्तिशाली रणनीति हो। धेरै सामाजिक वैज्ञानिकहरूले गर्न, मिलान प्रयोगहरू गर्न दोस्रो सबै भन्दा राम्रो जस्तै महसुस तर अलिकति संशोधित गर्न, गर्नुपर्छ भनेर एक विश्वास छ। 1) को प्रभाव मा heterogeneity महत्त्वपूर्ण छ र 2) मिलानका लागि राम्रो observables छन्: जब विशाल डाटा मा मिल्दो क्षेत्र प्रयोगहरू एउटा सानो संख्या भन्दा राम्रो हुन सक्छ। तालिका 2.4 मिल्ने कति ठूलो डाटा स्रोतहरु संग प्रयोग गर्न सकिन्छ केही अन्य उदाहरण प्रदान गर्दछ।

तालिका 2.4: डिजिटल निशान भित्र निष्पक्ष तुलना फेला पार्न मिल्ने प्रयोग अध्ययन को उदाहरण।
ठोस ध्यान ठूलो डेटा स्रोत उद्धरण
प्रहरी हिंसा मा shootings को प्रभाव रेकर्ड-र-frisk रोक्न Legewie (2016)
परिवार र छिमेकी मा सेप्टेम्बर 11, 2001 को प्रभाव मतदान रेकर्ड र दान रेकर्ड Hersh (2013)
सामाजिक contagion संचार र उत्पादन ग्रहण डाटा Aral, Muchnik, and Sundararajan (2009)

निष्कर्ष मा, गैर-प्रयोगात्मक डाटा देखि causal प्रभाव अनुमान गर्न अनुभवहीन दृष्टिकोण खतरनाक छन्। तर, बलियो देखि weakest एक Continuum साथ झूट causal अनुमान बनाउन लागि रणनीति र अनुसन्धानकर्ताहरूले गैर-प्रयोगात्मक डाटा भित्र निष्पक्ष तुलना पत्ता लगाउन सक्नुहुन्छ। प्राकृतिक प्रयोगहरू र मिलान: सधैं-, ठूलो डाटा प्रणाली को विकास प्रभावकारी दुई अवस्थित विधिहरू प्रयोग गर्न हाम्रो क्षमता बढ्छ।