वजन जानीबुझी यो नमूना प्रक्रिया कारण विकृतिहरु सच्याउन सक्नुहुन्छ।
सम्भावना नमूनाहरू सबै मानिसहरू ज्ञात, गैर-शून्य समावेश को सम्भावना छ ती हुन्, र साधारण सम्भावना नमूना डिजाइन सरल छ जहाँ प्रत्येक व्यक्ति समावेश को बराबर सम्भावना छ अनियमित नमूना। उत्तरदाताओं सिद्ध कार्यान्वयन (जस्तै, कुनै कवरेज त्रुटि र कुनै गैर-प्रतिक्रिया) संग सरल अनियमित नमूना मार्फत चयन गर्दा, त्यसपछि अनुमान सरल नमूना हुनेछ-मा जनसंख्याको एक लघु संस्करण औसत-हुन किनभने छ।
सरल अनियमित नमूना शायद तर, व्यवहार मा प्रयोग गरिन्छ। बरु, अनुसन्धानकर्ताहरूले जानीबुझी लागत कम गर्न र शुद्धता वृद्धि गर्न समावेशीकरणको को unequal सम्भावनाको मानिसहरूलाई चयन गर्नुहोस्। अनुसन्धानकर्ताहरूले जानीबुझी समावेश विभिन्न सम्भावनाको मानिसहरूलाई चयन गर्दा, त्यसपछि समायोजन नमूना प्रक्रिया कारण पनि विकृतिहरु पूर्ववत गर्न आवश्यक छ। अर्को शब्दमा, नमूना चयन गरिएको कसरी हामी एक नमूना देखि generalize कसरी निर्भर गर्दछ।
उदाहरणका लागि, वर्तमान जनसंख्या सर्वेक्षण (सीपीएस) बेरोजगारी दर अनुमान गर्न अमेरिकी सरकारले प्रयोग गरिन्छ। , अनुहार-को अनुहार त टेलिफोनद्वारा वा प्रत्येक महिना बारेमा 1,00,000 मानिसहरू अन्तरवार्ता छन्, र परिणाम अनुमानित बेरोजगारी दर उत्पादन गर्न प्रयोग गरिन्छ। सरकार प्रत्येक राज्य मा बेरोजगारी दर अनुमान गर्न इच्छा किनभने, यो कि सानो आबादी (जस्तै, रोड आइल्याण्ड) र धेरै ठूलो आबादी संग अमेरिका देखि संग अमेरिका मा पनि केही उत्तरदाताओं उपज थियो किनभने वयस्क को एक सरल अनियमित नमुना गर्न सक्नुहुन्न (जस्तै , क्यालिफोर्निया)। बरु, सीपीएस नमूनाहरू फरक दर मा विभिन्न राज्य अमेरिका मा मान्छे, एक प्रक्रिया चयन को unequal सम्भावना साथ stratified नमूना भनिन्छ। उदाहरणका लागि, यदि सीपीएस 2,000 उत्तरदाताओं प्रति राज्य, त्यसपछि रोड आइल्याण्ड मा वयस्क क्यालिफोर्निया मा वयस्क भन्दा समावेश लगभग 30 पटक उच्च सम्भावना हुनेछ (प्रति 8,00,000 वयस्क 2,000 उत्तरदाताओं बनाम क्यालिफोर्निया: प्रति 30.000.000 वयस्क 2,000 उत्तरदाताओं रोड आइल्याण्ड) चाहन्थे। हामी पछि देख्ने रूपमा, unequal सम्भावना संग नमूना यस प्रकारको पनि डाटा को अनलाइन स्रोतहरु संग हुन्छ, तर सीपीएस विपरीत, नमूना संयन्त्र सामान्यतया ज्ञात वा छैन शोधकर्ता नियन्त्रित छ।
यसको नमूना डिजाइन दिइएको, सीपीएस छैन अमेरिकी सीधा प्रतिनिधि हो; यसलाई रोड आइल्याण्ड बाट धेरै मानिसहरू र क्यालिफोर्निया पनि केही पनि समावेश छ। तसर्थ, यो नमूना मा बेरोजगारी दर संग देश मा बेरोजगारी दर अनुमान गर्न मूर्ख हुनेछ। बरु नमूना मतलब को, यो राम्रो एक भारित मतलब, रोड आइल्याण्ड मानिसहरूलाई क्यालिफोर्निया मानिसहरूलाई भन्दा समावेश हुने बढी सम्भावना थिए जहाँ वास्तवमा लागि वजन खाता लिन छ। उदाहरणका लागि, क्यालिफोर्निया बाट प्रत्येक व्यक्ति तिनीहरूले अनुमान-र प्रत्येक रोड आइल्याण्ड बाट हुनेछ व्यक्ति अझ गणना हुनेछ upweighted- हुनेछ downweighted-तिनीहरूले अनुमान मा कम गणना हुनेछ। सार मा, तपाईं कम सिक्न सम्भावना छ कि मानिसहरूलाई थप आवाज दिइन्छ।
यो खेलौना उदाहरण एउटा महत्त्वपूर्ण तर सामान्यतः गलत समझ बैठी बिन्दु देखाउँछ: एक नमूना अर्डर राम्रो अनुमान उत्पादन गर्न मा जनसंख्याको एक लघु संस्करण हुनु आवश्यक छैन। पर्याप्त डाटा संकलन गरियो भन्ने बारेमा ज्ञात छ भने, तब जानकारी नमूना बाट अनुमान गर्दा प्रयोग गर्न सकिन्छ। दृष्टिकोण म वर्णन-र गर्नुभएको म प्राविधिक मा गणितीय वर्णन कि शास्त्रीय सम्भावना नमूना रूपरेखा भित्र squarely appendix-ढले। अब, म त्यही विचार गैर-सम्भावना नमूनाहरू लागू गर्न सकिन्छ कसरी देखाउने छौँ।