संभावना नमूने और गैर संभावना नमूने है कि व्यवहार में अलग नहीं हैं; दोनों ही मामलों में, यह सब वजन के बारे में है।
नमूना सर्वेक्षण करने के लिए अनुसंधान मौलिक है। शोधकर्ताओं ने लगभग कभी अपने लक्ष्य की आबादी में हर किसी को अपनी सवाल पूछते हो। इस संबंध में, सर्वेक्षण अद्वितीय नहीं हैं। अधिकांश अनुसंधान, एक तरह से या किसी अन्य रूप में, नमूने शामिल है। कभी-कभी यह नमूना शोधकर्ता द्वारा स्पष्ट रूप से किया जाता है; दूसरी बार यह संकेत भी होता है। उदाहरण के लिए, एक शोधकर्ता कि उसे विश्वविद्यालय में स्नातक छात्रों पर एक प्रयोगशाला प्रयोग रन भी एक नमूना ले लिया है। इस प्रकार, नमूना एक समस्या यह है कि इस पुस्तक में ऊपर आता है। वास्तव में, सबसे आम चिंता है कि मैं डेटा के डिजिटल युग स्रोतों के बारे में सुना है में से एक है, यह चिंता का विषय है दोनों कम गंभीर और अधिक सूक्ष्म से कई लोगों का एहसास है, "वे प्रतिनिधि नहीं हैं।" हम इस खंड में देखेंगे। वास्तव में, मैं तर्क है कि "प्रातिनिधिकता" की पूरी अवधारणा संभावना और गैर संभावना नमूने के बारे में सोच के लिए मददगार नहीं है। इसके बजाय, कुंजी कैसे डाटा एकत्र किया गया था और उस डेटा संग्रह में किसी भी पूर्वाग्रहों अनुमान लगाते समय कैसे पूर्ववत किया जा सकता बारे में सोचना है।
वर्तमान में, प्रतिनिधित्व करने के लिए प्रमुख सैद्धांतिक दृष्टिकोण संभावना नमूना है। डेटा एक संभावना नमूने विधि पूरी तरह से निष्पादित किया गया है कि के साथ एकत्र कर रहे हैं, शोधकर्ताओं तरीका है कि वे लक्ष्य की आबादी के बारे में निष्पक्ष अनुमान बनाने के लिए एकत्र किए गए थे के आधार पर अपने डेटा वजन करने के लिए सक्षम हैं। हालांकि, सही संभावना नमूना मूल रूप से कभी नहीं असली दुनिया में होता है। वहां आम तौर पर दो मुख्य समस्याएं 1) लक्षित जनसंख्या और फ्रेम आबादी और 2 के बीच मतभेद) गैर प्रतिक्रिया (ये वास्तव में समस्या है कि साहित्यिक डाइजेस्ट सर्वेक्षण से बिगड़ गई हैं)। इस प्रकार, बल्कि क्या वास्तव में दुनिया में होता है के एक यथार्थवादी मॉडल के रूप में संभावना नमूने के बारे में सोच की तुलना में, यह बेहतर है एक उपयोगी, सार मॉडल के रूप में संभावना नमूने के बारे में सोचना है, बहुत पसंद है जिस तरह से भौतिकविदों एक असीम लंबे नीचे रोलिंग घर्षणहीन गेंद के बारे में सोचते रैंप।
संभावना नमूना लेने के लिए वैकल्पिक गैर संभावना नमूना है। संभाव्यता और गैर संभावना नमूने के बीच मुख्य अंतर शामिल किए जाने के एक ज्ञात संभावना है कि संभावना आबादी में हर किसी के नमूने के साथ है। वहाँ वास्तव में कर रहे हैं, गैर संभावना नमूने की कई किस्में हैं, और डेटा संग्रह के इन तरीकों डिजिटल युग में तेजी से सामान्य होते जा रहे हैं। लेकिन, गैर संभावना नमूने सामाजिक वैज्ञानिकों और सांख्यिकीविदों के बीच एक भयानक प्रतिष्ठा है। वास्तव में, गैर संभावना नमूने ऐसे साहित्यिक डाइजेस्ट असफलता (पहले चर्चा) और 1948 ( "डेवी हार ट्रूमैन") अमेरिका के राष्ट्रपति चुनाव के बारे में गलत भविष्यवाणी के रूप में सर्वेक्षण शोधकर्ताओं का सबसे नाटकीय विफलताओं में से कुछ के साथ जुड़ा हुआ है (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) ।
बहरहाल, समय के दो कारणों के लिए गैर संभावना नमूने पर पुनर्विचार करने के लिए सही है। सबसे पहले, के रूप में संभावना नमूने व्यवहार में क्या करने के लिए तेजी से मुश्किल हो गए हैं, संभावना नमूने और गैर संभावना नमूने के बीच की रेखा को धुंधला है। जब वहाँ इस तरह गैर-प्रतिक्रिया की उच्च दर (वहाँ के रूप में अब असली सर्वेक्षणों में हैं), उत्तरदाताओं के लिए समावेशन की वास्तविक संभावना नहीं जाना जाता है, और, संभावना नमूने और गैर संभावना नमूने कर रहे हैं के रूप में अलग-अलग कई शोधकर्ताओं का मानना है के रूप में नहीं कर रहे हैं। बाद के स्तरीकरण: वास्तव में, जैसा कि हम नीचे देखेंगे, दोनों तरीकों मूल रूप से एक ही आकलन विधि पर भरोसा करते हैं। दूसरा, संग्रह और गैर संभावना नमूनों के विश्लेषण में कई घटनाएं हुई हैं। इन विधियों के तरीकों है कि अतीत में समस्याओं का कारण से काफी अलग है मुझे लगता है कि यह समझ में आता है के रूप में उनमें से सोच रहे हैं "गैर संभावना नमूने 2.0।" हम क्योंकि त्रुटियों कि क्या हुआ की गैर संभावना तरीकों के लिए एक तर्कहीन घृणा नहीं करना चाहिए बहुत समय पहले।
इसके बाद, इस तर्क और अधिक ठोस बनाने के लिए, मैं मानक संभावना नमूना और भार (धारा 3.4.1) की समीक्षा करेंगे। मुख्य विचार यह है कि आप अपने डेटा कैसे एकत्र प्रभावित करना चाहिए कि कैसे आप अनुमान कर रहा है। विशेष रूप से, अगर हर कोई शामिल किए जाने की ही संभावना नहीं है, तो हर किसी को एक ही वजन नहीं होना चाहिए। दूसरे शब्दों में, अगर आपके नमूना लोकतांत्रिक नहीं है, तो अपने अनुमानों नहीं लोकतांत्रिक होना चाहिए। भार समीक्षा करने के बाद, मैं गैर संभावना नमूना लेने के लिए दो दृष्टिकोण का वर्णन करेंगे: एक है कि संयोग से एकत्र आंकड़ों की समस्या (धारा 3.4.2) के साथ सौदा करने के लिए भार पर केंद्रित है, और कैसे एक डेटा पर अधिक नियंत्रण के लिए जगह की कोशिश करता है कि एकत्र (धारा 3.4.3)। मुख्य पाठ में तर्क शब्दों और चित्रों के साथ नीचे समझाया जाएगा; पाठकों के लिए एक अधिक गणितीय उपचार चाहते हैं, जो भी तकनीकी परिशिष्ट देखना चाहिए।