मलाई लाग्छ कि अनुभवहरू बुझ्न उत्तम तरिका संभावित परिणाम ढाँचा हो (जुन मैले अध्याय 2 मा गणितीय नोटमा छलफल गरे)। सम्भावित परिणाम ढाँचामा सन् 3 9 मा वर्णन गरिएको डिजाइन-आधारित नमूनाका विचारहरूका नजिकको सम्बन्ध छ (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) । यो परिशिष्ट यस्तो तरिकाले लेखिएको छ कि जडान जोड दिन्छ। यो जोड थोडा गैर-परम्परागत हो, तर मलाई लाग्छ कि नमूना र प्रयोगहरू बीचको सम्बन्ध सहयोगी छ: यसको मतलब यो हो कि यदि तपाई नमूना बारे केहि थाहा हुनुहुन्छ तब तपाइँलाई प्रयोगका बारेमा केहि कुरा थाहा छ। म यो नोटहरूमा देखाउँछु, संभावित परिणाम फ्रेमवर्कले प्रभाव पार्ने प्रभावहरूको अनुमान गर्न randomized controlled experiments को शक्ति प्रकट गर्दछ, र यसले पूर्ण निष्पादित प्रयोगहरूको साथ के गर्न सकिन्छ को सीमाहरू पनि देखाउँछ।
यो परिशिष्टमा, म यो नोटहरू थप आत्म-निहित बनाउनका लागि अध्याय 2 मा गणितीयत्मक नोटबाट केही सामाग्री डुप्लिकेट, संभावित परिणाम ढाँचाको वर्णन गर्नेछु। त्यसपछि म इष्टतम आवंटन र फरक-फरक-फरक-फरक मतभेदकर्ताहरूको छलफल सहित औसत उपचार प्रभावहरूको अनुमानको परिमाणको बारेमा केहि उपयोगी परिणामहरू वर्णन गर्नेछु। यो परिशिष्ट Gerber and Green (2012) भारी मात्रामा आउँछ।
सम्भावित परिणाम ढाँचा
सम्भावित परिणाम ढाँचाको वर्णन गर्न, विकिपीडियामा भविष्यको योगदानमा बर्नस्टार प्राप्त गर्ने प्रभावको अनुमान गर्न रेजिभो र भ्यान डे रिजिटको प्रयोगमा फर्किनुहोस्। सम्भावित परिणाम ढाँचामा तीन मुख्य तत्वहरू छन्: एकाइहरू , उपचारहरू , र सम्भावित परिणामहरू । Restivo र वान डे रिज को मामला मा, एकाइहरु संपादकहरु को योग्य थिए - जो योगदानकर्ता को शीर्ष 1% मा - जो अझै सम्म एक barnstar नहीं प्राप्त भएको थियो। हामी यी सम्पादकहरू सूचित गर्न सक्छौं \(i = 1 \ldots N\) । उनीहरूको प्रयोगमा उपचारहरू "बर्नस्टार" वा "नो बर्न स्टार" थिए र मैले \(W_i = 1\) भने यदि व्यक्ति \(i\) उपचार अवस्थामा छ र \(W_i = 0\) अन्यथा। सम्भावित परिणाम फ्रेम को तेस्रो तत्व सबैभन्दा महत्वपूर्ण हो: सम्भावना परिणामहरू । यो थोडा अधिक अवधारणात्मक हो किनकि तिनीहरू "सम्भावित" परिणामहरू - जुन हुन सक्दछ। प्रत्येक विकिपीडिया सम्पादकका लागि, एक सम्पादनको संख्या कल्पना गर्न सक्दछ जुन उनी उपचार अवस्थामा बनाइनेछ ( \(Y_i(1)\) ) र त्यो संख्या जुन उनीहरूको नियन्त्रण अवस्थामा बनाइनेछ ( \(Y_i(0)\) )।
ध्यान दिनुहोस् कि एकाइ, उपचार, र परिणामहरूको यो छनोटले यो प्रयोगबाट के सिक्न सकिन्छ भनेर परिभाषित गर्दछ। उदाहरणका लागि, कुनै अतिरिक्त धारणा बिना, रिभिभो र वान डी रिल्ट सबै विकिपीडिया सम्पादकहरूमा बर्नस्टारहरूको प्रभाव बारे वा केहि पनि भन्न सक्नुहुन्न वा सम्पादन गुणस्तरको परिणाममा। सामान्यतया, एकाइ, उपचार, र परिणामहरूको छनौट अध्ययनका लक्ष्यहरूमा आधारित हुनुपर्छ।
यी सम्भावित परिणामहरू - तालिकामा संक्षेप गरिएका छन् 4.5-कसैले व्यक्तिको लागि उपचारको कारण प्रभावलाई परिभाषित गर्न सक्छ \(i\) रूपमा
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]
मेरो लागि, यो समीकरण एक causal प्रभाव को परिभाषित गर्न को लागि स्पष्ट तरिका हो, र, धेरै सरल भए तापनि यस ढाँचा धेरै महत्त्वपूर्ण र रोचक तरिका (Imbens and Rubin 2015) सामान्य (Imbens and Rubin 2015) ।
व्यक्ति | उपचार अवस्थामा सम्पादन गर्दछ | नियन्त्रण अवस्थामा सम्पादन गर्दछ | उपचार प्रभाव |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
N | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
अर्थ | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
यदि हामी यस तरिकामा कारणता परिभाषित गर्छौं, तथापि, हामी एक समस्यामा चल्छौं। लगभग सबै अवस्थामा, हामी दुवै सम्भाव्य परिणामहरू पालन गर्न पाउँदैनौं। त्यो हो, एक विकिपीडिया विशिष्ट संपादकले बर्न स्टार प्राप्त गर्दछ वा होइन। यसैले, हामी संभावित परिणामहरु मध्ये एक को \(Y_i(1)\) वा \(Y_i(0)\) - तर दुवै होइन। दुवै सम्भावित परिणामहरू पालन गर्न असक्षमता यस्तो प्रमुख समस्या हो जुन Holland (1986) ले यसलाई आधारभूत समस्याको मौलिक समस्या भनिन्छ।
सौभाग्यवश, हामी अनुसन्धान गरिरहँदा, हामीसँग केवल एक व्यक्ति छैन, हामीसँग धेरै व्यक्ति छन्, र यो कारण फरक पहल को मौलिक समस्या को वरिपरि एक तरिका प्रदान गर्दछ। व्यक्तिगत-स्तर उपचारको प्रभाव अनुमान गर्न प्रयास गर्नुको सट्टा, हामी औसत उपचार प्रभाव अनुमान गर्न सक्छौं:
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]
यो अझै पनि \(\tau_i\) व्यक्त गरिएको छ जो अनावश्यक छन्, तर केहि बीजगणना ( Gerber and Green (2012) Eq 2.8 हामी प्राप्त गर्छौं
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]
समीकरण 4.3 देखि थाहा हुन्छ कि यदि हामी उपचार को तहत आबादी औसत परिणाम ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) र आनुवंशिक औसत परिणाम नियंत्रण ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), त्यसपछि हामी कुनै पनि व्यक्ति को लागि उपचार प्रभाव को अनुमान को बिना, औसत उपचार प्रभाव अनुमान गर्न सक्छन्।
अब मैले आफ्नो अनुमान लगाएको छु - हामीले अनुमान गर्न प्रयास गरिरहेको कुरा - म कसरी वास्तवमा डेटा संग यसको अनुमान अनुमान गर्न सक्दछु। मलाई यो नमूनात्मक समस्याको बारेमा एक नमूना समस्याको बारेमा सोच्न चाहन्छु (अध्याय 3 मा गणितीयत्मक नोटहरूमा सोच्नुहोस्)। कल्पना गर्नुहोस् कि हामी अनियमित रूपमा केही व्यक्तिले उपचारको अवस्थालाई हेर्छौं र हामी अनियमित रूपमा केही व्यक्तिलाई नियन्त्रण हालतमा हेर्छौं, त्यसपछि हामी प्रत्येक शर्तमा औसत परिणाम अनुमान गर्न सक्छौं:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]
कहाँ \(N_t\) र \(N_c\) उपचार र नियन्त्रण सर्तहरूमा व्यक्तिहरूको संख्या हो। समीकरण 4.4 एक अंतर को अर्थ अनुमानक हो। नमूना डिजाइन को कारण, हामी जान्दछन् कि पहिलो शब्द उपचार को तहत औसत परिणाम को लागि एक निष्पक्ष अनुमानक छ र दोस्रो अवधि नियंत्रण को तहत एक निष्पक्ष अनुमानक छ।
कुन अनियमितता सक्षम गर्न सकिन्छ भन्ने बारे सोच्ने तरिका यो हो कि यसले उपचार र नियन्त्रण समूह बीच तुलना उचित छ किनकि अनियमितताले यो सुनिश्चित गर्दछ कि दुई समूहहरू एक-अर्काको समान हुन्छन्। यो समानता हामीले हामीले मापन गरेका चीजहरूको लागि राख्दछौं (प्रयोग भन्दा 30 दिनहरुमा सम्पादनको संख्या भन्नुहोस्) र हामीले हामीले नापेका चीजहरू (लिङ्ग भन्नुहोस्)। दुवै अवलोकन र unobserved कारक मा ब्यालेन्स सुनिश्चित गर्न यो क्षमता महत्वपूर्ण छ। अनावश्यक कारकहरूमा स्वचालित सन्तुलनको शक्तिलाई हेर्न, चलो कल्पना गर्दछ कि भविष्यको अनुसन्धानले महिलाहरु भन्दा अधिक पुरुषहरु लाई पुरस्कारको लागी अधिक उत्तरदायी छन। के रिटिभो र भ्यान डे रिजिटको प्रयोगको परिणामलाई अमान्य पार्ने हो? नहीं। अनियमितता द्वारा, उनि सुनिश्चित गरे कि सबै अपरिवर्तनीयहरु संतुलित मा संतुलित हुनेछ। अज्ञात विरुद्ध यो सुरक्षा धेरै शक्तिशाली छ, र यो एक महत्त्वपूर्ण तरिका हो जुन अध्याय 2 मा वर्णन गरिएको गैर-प्रयोगात्मक प्रविधिहरूबाट अलग हुन्छ।
पुरा जनसंख्याको लागि उपचार प्रभाव को परिभाषित गर्न को अतिरिक्त, यो मान्छे को सबसेट को लागि एक उपचार को प्रभाव को परिभाषित गर्न सम्भव छ। यो सामान्यतया सशर्त औसत उपचार प्रभाव (CATE) भनिन्छ। उदाहरणको लागि, रिभिभो र भ्यान डे रिजिट द्वारा अध्ययनमा, चलोको कल्पना गर्दछ कि \(X_i\) प्रयोग गर्ने 90 दिनको अवधिमा सम्पादनको मध्य संख्या भन्दा माथि वा सम्पादक हो कि के हो? एकले यी लाइट र भारी सम्पादकहरूको लागि एक फरक फरक उपचारको गणना गर्न सक्दछ।
सम्भावित परिणाम फ्रेमवर्क कारण causality र प्रयोगहरूको बारेमा सोच्ने एक शक्तिशाली तरिका हो। तथापि, त्यहाँ दुई अतिरिक्त जटिलताहरू छन् जुन तपाईंले ध्यान राख्नुपर्छ। यी दुई जटिलताहरू प्राय: स्थिर इकाई उपचार मान असमानता (SUTVA) को बीच एकसाथ लुम्प गरिन्छ। SUTVA को पहिलो भाग यो धारणा हो कि व्यक्ति \(i\) को परिणाम को लागी एकमात्र चीज हो कि त्यो व्यक्ति को उपचार मा या नियंत्रण को स्थिति मा थियो। अन्य शब्दहरुमा, यो मानिन्छ कि व्यक्ति \(i\) अन्य मानिसहरूलाई दिएको उपचार द्वारा प्रभावित छैन। यो कहिलेकाहीं "कुनै हस्तक्षेप" वा "कुनै spillovers" भनिन्छ, र यसको रूपमा लेख्न सकिन्छ:
\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]
जहाँ \(\mathbf{W_{-i}}\) व्यक्तिको बाहेक सबैका लागि उपचार स्थितिहरूको वेक्टर हो \(i\) । एक तरिका यो उल्लङ्घनको हुन सक्छ यदि एक व्यक्तिबाट उपचार अर्को व्यक्तिमा, या त सकारात्मक वा नकारात्मक रूपमा फैलिन्छ। रिभिभो र भ्यान डे रिजिटको प्रयोगमा फर्किँदै, दुई मित्रहरू \(i\) र \(j\) र त्यो व्यक्तिलाई कल्पना गर्दछ \(i\) एक barnstar र \(j\) गर्दैन। यदि \(i\) बर्नस्टारले \(j\) लाई थप (प्रतिस्पर्धाको भाव बाहिर) सम्पादन गर्दछ वा कम (निराशाको भावबाट बाहिर) सम्पादन गर्दछ, त्यसपछि SUTVA उल्लङ्घन गरिएको छ। उपचारको प्रभाव उपचार गर्ने अन्य व्यक्तिहरूको कुल संख्यामा निर्भर गर्दछ भने यो उल्लङ्घन गर्न सकिन्छ। उदाहरणका लागि, यदि रिभिभो र भ्यान डे रिज 100 को बट्टा 1,000 वा 10,000 भन्दा बढी बर्नरनेहरू दिएका थिए भने यसले यसलाई बर्नस्टार प्राप्त गर्नमा प्रभाव पारेको हुनसक्छ।
दोस्रो मुद्दा SUTVA मा लम्प्ड यो धारणा हो कि केवल एक मात्र सम्बन्धित उपचार एक शोधकर्ता उद्धार गर्दछ; यो धारणा कहिलेकाहीं कुनै लुकेको उपचार वा बहिष्कार भनिन्छ । उदाहरणका लागि, रिभिभो र भ्यान डे रिज मा, यो हुन सक्छ कि एक बर्नस्टार गरेर शोधकर्ताहरु को लोकप्रिय लोकप्रिय संपादकों को पृष्ठ मा प्रदर्शित गर्न को कारण बनयो र यो लोकप्रिय संपादक पृष्ठ मा भएको थियो - बर्न स्टार प्राप्त गर्न को लागी यो थियो कि - जसले सम्पादन सम्पादनमा परिवर्तनको कारण बनायो। यदि यो साँचो हो भने, त्यसपछि Barnstar को प्रभाव लोकप्रिय सम्पादक पृष्ठमा रहेको प्रभावको भेदभाव होइन। निस्सन्देह, यो स्पष्ट छैन भने, एक वैज्ञानिक दृष्टिकोण बाट यो आकर्षक वा अपूर्ण विचार गर्नु पर्छ। यो हो, तपाई एक शोधकर्तालाई कल्पना गर्न सक्नुहुन्छ कि बर्नस्टार प्राप्त गर्ने प्रभावले सबै पछि लाग्ने उपचार समावेश गर्दछ जुन बार्नास्टार ट्रिगर हुन्छ। वा तपाईं एक परिस्थिति कल्पना गर्न सक्नुहुनेछ जहाँ अनुसन्धानले यी सबै चीजहरूबाट बर्नस्टारहरूको प्रभाव अलग गर्न चाहन्छ। यसको बारेमा सोच्नु एक तरिका हो भने त्यहाँ Gerber and Green (2012) (पी। 41) ले "सममित्रीमा ब्रेकडाउन" लाई बोलाइएको कुराको लागी केहि कुरा सोध्नु हुन्छ? अन्य शब्दहरुमा, उपचार को लागी कुनै अन्य चीज छ कि उपचार मा मान्छे को कारण बनता छ र नियंत्रण को स्थिति अलग तरिकाले व्यवहार गरे? सममित्री तोड्ने बारे चिन्ताहरू के छन् चिकित्सकीय परीक्षणहरूमा नियन्त्रण समूहमा नेतृत्व गर्ने ठाउँ ठाउँबो गोली लिन। यस तरिका, शोधकर्ताहरु लाई सुनिश्चित गर्न सकिन्छ कि दुई स्थितियों को बीच एकमात्र अंतर वास्तविक दवाई हो र गोली को लेने को अनुभव छैन।
SUTVA मा अधिकका लागि, गर्बर Gerber and Green (2012) को धारा 2.7 हेर्नुहोस्, Morgan and Winship (2014) भाग 2, र भाग 1.6 को Imbens and Rubin (2015) ।
प्रेसिजन
अघिल्लो सेक्सनमा, मैले औसत उपचार प्रभाव अनुमान कसरी अनुमान लगाएको छु। यस खण्डमा, म यी अनुमानहरूको चरमताबारे केही विचारहरू प्रदान गर्नेछु।
यदि तपाईले दुई नमूना माध्यमहरू बीचको अंतरको अनुमान लगायत औसत उपचार प्रभावको अनुमान गर्नुहुन्छ भने, त्यसपछि यो सम्भव छ कि औसत उपचार प्रभावको मानक त्रुटि यो हो:
\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]
जहाँ \(m\) मान्छेलाई उपचार र \(Nm\) लाई नियन्त्रण गर्न असाइन गरियो ( Gerber and Green (2012) , इ। 3.4 हेर्नुहोस्)। यसैले, जब धेरै मानिसहरूलाई उपचार गर्न असाइन गर्न सकिन्छ र कति कति असाइन गर्न नियन्त्रण गर्न सकिन्छ, तपाईले देख्न सक्नुहुन्छ कि यदि \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , त्यसपछि तपाइँ \(m \approx N / 2\) " चाहनुहुन्छ, जबसम्म उपचारको लागत र नियन्त्रण एउटै हुन्। समीकरण 4.6 स्पष्टीकरण किन मतदान मा सामाजिक जानकारी को प्रभाव को बारे मा बॉन्ड र सहकर्मियों (2012) प्रयोग को डिजाइन (आंकडा 4.18) अपर्याप्त सांख्यिकीय थियो। याद गर्नुहोस् कि उनको उपचार अवस्था मा 9 0% सहभागीहरु थिए। यसको अर्थ थियो कि नियन्त्रण स्थितिको मतलब व्यवहार सही रूपमा अनुमान गरिएको थिएन जसको कारण हुन सक्छ, जुन यसको अर्थ हो कि उपचार र नियन्त्रण अवस्था बीचको अनुमानित भिन्नता सही रूपमा अनुमान हुन सकेन। अधिक List, Sadoff, and Wagner (2011) लागि प्रतिभागिहरु को इष्टतम आवंटन को शर्तहरु, जब लागतहरु को बीच लागत फरक हुन्छ सहित, List, Sadoff, and Wagner (2011) ।
अन्तमा, मुख्य पाठमा, मैले फरक-फरक-फरक मतभेदको अनुमानक वर्णन गरे, जुन सामान्यतया एक मिश्रित डिजाइनमा प्रयोग गरिन्छ, फरक-फरक-एन्टिमेटर भन्दा सानो भिन्नता हुन सक्छ, जुन सामान्यतया बीच-विषयहरूमा प्रयोग गरिन्छ। डिजाइन। यदि \(X_i\) उपचार गर्नु अघि परिणामको मान हो, त्यस मात्रामा हामी फरक-फरक-भिन्न मतभेदको साथ अनुमान गर्न प्रयास गरिरहेका छौं:
\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]
त्यो मात्राको मानक त्रुटि हो ( Gerber and Green (2012) , इ। 4.4 हेर्नुहोस्)
\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]
Eq को तुलना 4.6 र ई.ए. 4.8 ले बताउँछ कि अंतर-इन-भिन्नताको दृष्टिकोण एक सानो मानक त्रुटि हुनेछ जब ( Gerber and Green (2012) हेर्नुहोस् Gerber and Green (2012) इ। 4.6)
\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]
अचानक, जब \(X_i\) \(Y_i(1)\) र \(Y_i(0)\) \(X_i\) को धेरै भविष्यसूचक हो, त्यसपछि तपाइँले अधिक सटीक अनुमान प्राप्त गर्न सक्नुहुनेछ अंतर-फरक-भिन्न भिन्नताबाट फरक फरक - को अर्थ एक। रिभिभो र व्यान डे रिजिटको सन्दर्भमा यो बारेमा सोच्ने एक तरिका यो हो कि मानिसहरु सम्पादन गर्ने रकममा धेरै प्राकृतिक भिन्नताहरू छन्, त्यसैले यसले उपचार र परिस्थितिको तुलना गर्न गाह्रो बनाउँछ: यो एक सापेक्ष पत्ता लगाउन गाह्रो हुन्छ। शोर परिणाम डेटामा सानो प्रभाव। तर यदि तपाईले यो स्वाभाविक रूप देखि उत्पन्न विविधता को अंतर-आउट गर्छ भने, त्यसपछि त्यहाँ धेरै कम परिवर्तन हुन्छ, र यसले सानो प्रभावको पत्ता लगाउन सजिलो बनाउँछ।
Frison and Pocock (1992) फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक-फरक फरक हुन्छन्। विशेष गरी, तिनीहरू एकोवो को अनुशंसा गर्छन, जुन मैले यहाँ कवर गरेको छैन। साथै, धेरै पोस्ट-उपचार परिणाम उपायहरूको महत्त्वको छलफलको लागि McKenzie (2012) हेर्नुहोस्।