प्रतिनिधित्व आफ्नो लक्ष्य जनसंख्या आफ्नो उत्तरदाताओं देखि inferences बनाउने बारे छ।
कतिपय उत्तरदायीहरूलाई ठूलो आबादीमा आक्रोश गर्दा जब यो प्रकारका त्रुटिहरू बुझ्न सकिन्छ, त्यसमा 1 9 36 अमेरिकी राष्ट्रपतिको चुनावको परिणाम भविष्यवाणी गर्ने प्रयासमा साहित्य डाइजेस्ट स्ट्राको सर्वेक्षणमा छलफल गरौं। यद्यपि यो 75 वर्ष भन्दा बढी भयो, यो अब्राहमले आज पनि शोधकर्ताहरूलाई सिकाउन महत्त्वपूर्ण पाठ छ।
साहित्यिक डाइजेस्ट एक लोकप्रिय सामान्य रुचि पत्रिका थियो, र 1 9 80 मा सुरु भयो उनीहरूले राष्ट्रपति चुनावको नतिजाको भविष्यवाणी गर्न स्ट्राङको दौड सुरु गरे। यी भविष्यवाणीहरू बनाउन को लागी, उनीहरूले बत्तीहरू धेरै मानिसहरूलाई पठाउँछन् र त्यसपछि बस फर्केर फर्किएका पानाहरू टेलिभिजनमा पठाउँछन्; साहित्यिक डाइजेस्टले गर्भ गरेअनुसार तिनीहरूले प्राप्त गरेका बत्तीहरू "भारित, समायोजित, र व्याख्या गरेनन्"। यो प्रक्रियाले 1 9 20, 1 9 24, 1 9 28 र 1 9 32 मा चुनावको विजेतालाई सही रूपमा भविष्यवाणी गरेको थियो। 1 9 36 मा, ठूलो अवसाद, साहित्यको बीचमा डाइजेस्टले 10 लाख मान्छेलाई मतदान गर्न पठाउनुभयो, जसका नामहरू प्रायः टेलीफोन डाइरेक्टरी र मोटरबक्स दर्ता रेकर्डबाट आए। उनीहरूले उनीहरूको विधिशास्त्र कसरी वर्णन गरे:
"डीजीजेस्टको चिकनी-चलिरहेको मिसिनले कठिन तथ्याङ्कको अनुमान लगाउन कम्तीमा 30 वर्षको अनुभवको तीव्र परिशुद्धताको साथ चल्छ ... यो हप्ता 500 पेन्सन एक लाखको चौथाई भन्दा बढी खर्ब्यो। हरेक दिन, न्यू यर्कमा मोटर-रिबन गरिएको चौथो एवेन्यू भन्दा ठूलो कोठामा 400 जना कर्मचारीहरूले एक लाख टुक्रा छापेका कुराहरूलाई लुकाउँछन् - चालीस शहरका ब्लकहरू प्रशस्त गर्न-सङ्कलन लिफ्टहरू [sic] मा। हरेक घडी, द डेजेस्टको आफ्नै पोस्ट अफिस सबस्टेशनमा तीनवटा भाँडामा टाढा टाढा टाँस्ने मेसिनहरू सील र सेतो ढोका बन्दै गयो। कुशल डाक कर्मचारिहरु उनलाई बुलबुला mailsacks मा फेंक दिए; बेडा DIGEST ट्रकहरूले तिनीहरूलाई मेल-टेलिभिजन एक्सप्रेस गर्न लगाए। । । अर्को हप्ता, यी दस मिलियनहरूको पहिलो जवाफले पङ्क्तिबद्ध चिन्हहरूको आगमन लहर सुरु गर्नेछ, ट्रिपल चेक-इन, प्रमाणित, पाँच-पटक क्रस-वर्गीकृत र कुल मिलाउन। जब अन्तिम आंकडा तोडिन्छ र जाँच गरिएको छ, यदि अतीत अनुभव एक मानदण्ड हो भने, देशलाई 1 प्रतिशतको पङ्क्ति भित्र पचास लाख [मतदाता] को वास्तविक लोकप्रिय मत थाहा हुनेछ। "(22 अगस्त 1 9 36)
साहित्यिक डाइजेस्टको फाईलसिजाइजेशन आजको कुनै पनि "ठूलो डेटा" शोधकर्तालाई तुरुन्तै स्वीकार्य छ। वितरित 10 मिलियन मतदान मध्ये, एक अचम्म 2.4 मिलियन फर्काइयो - त्यो आधुनिक राजनैतिक निर्वाचन भन्दा लगभग 1,000 चोटि ठूलो छ। यी 2.4 मिलियन उत्तरदायीहरूबाट, यो निर्णय स्पष्ट थियो: एल्फ ल्यान्डन फ्रैंकलिन रुसेवेल्टले पराजित गर्न थाल्छन्। तर, वास्तवमा रुसवेल्टले ल्यान्डनलाई भू-भागमा पराजित गर्यो। कसरी डेटा डाइजेस्ट धेरै डाटाको साथ गलत हुन सक्छ? नमूनाको हाम्रो आधुनिक बुझाइले साहित्यिक डाइजेस्टका गल्तीहरूलाई स्पष्ट बनाउँछ र भविष्यमा यस्तै गल्तीहरूबाट बच्न सहयोग पुर्याउँछ।
नमूनाको बारेमा स्पष्ट रूपमा सोच्न हामीलाई हामीलाई चार विभिन्न समूहहरूको विचार गर्न आवश्यक छ (चित्र 3.2)। पहिलो समूह लक्षित जनसंख्या हो ; यो समूह हो कि शोधकर्ताले ब्याज को जनसंख्याको रूपमा परिभाषित गर्दछ। साहित्यिक डाइजेस्टको सन्दर्भमा, लक्ष्य आबादी 1 9 36 को राष्ट्रपति चुनावमा मतदाता थिए।
लक्ष्य आबादीमा निर्णय पछि, एक शोधकर्ताले नमूनाको लागी प्रयोग गर्ने व्यक्तिहरूको सूची विकास गर्न आवश्यक छ। यो सूची एक नमूना फ्रेम भनिन्छ र यसलाई त्यसमा व्यक्ति फ्रेम जनसंख्या भनिन्छ । आदर्श रूपान्तरण, आबादी र फ्रेम आबादी बिल्कुल नै हुनेछ, तर व्यवहारमा यो प्रायः मामला होइन। उदाहरणका लागि, साहित्यिक डाइजेस्टको सन्दर्भमा, फ्रेम आबादी 10 मिलियन व्यक्ति थिए जसका नामहरू टेलीफोन डाइरेक्टरी र मोटरबक्स दर्ता रेकर्डबाट मुख्य रूपमा आए। लक्षित आबादी र फ्रेम आबादीबीच मतभेद कवरेज त्रुटि भनिन्छ। कवरेज त्रुटि, आफैले, समस्याको ग्यारेन्टी गर्दैन। तथापि, यो कवरेज पूर्वाधारको नेतृत्व गर्न सक्छ यदि फ्रेम आबादीमा व्यक्ति लक्षित जनसंख्याको व्यक्तिबाट प्रणालीगत भिन्न हो जुन फ्रेम आबादीमा छैन। यो वास्तवमा साहित्यिक डाइजेस्ट सर्वेक्षणमा के भयो। तिनीहरूको फ्रेम आबादीमा व्यक्तिले अल्फ ल्यान्डनलाई समर्थन गर्न अधिक सम्भावना पाएका थिए किनभने उनीहरूले धनी थिए (1 9 1 9 मा सन् 1 99 3 मा टेलिफोन र मोटरमोबाइल अपेक्षाकृत नयाँ र महंगी थियो)। त्यसैले, साहित्यिक डाइजेस्ट पोलिसमा कवरेज त्रुटिले कवरेज पूर्वाधारको नेतृत्व गर्यो।
फ्रेम आबादी को परिभाषित गरे पछि, अगला चरण एक शोधकर्ता को लागि नमूना जनसंख्या को चयन गर्न को लागी हो; यी व्यक्ति हो जसले अनुसन्धानकर्ता साक्षात्कार गर्न प्रयास गर्नेछ। यदि नमूना फ्रेम जनसंख्या भन्दा फरक विशेषताहरू छ भने, त्यसपछि नमूना नमूना त्रुटि परिचय गर्न सक्छ। साहित्य डाइजेस्ट फिजिकको अवस्थामा, तथापि, त्यहाँ वास्तवमा कुनै नमूना थिएन - पत्रिका फ्रेम आबादीमा सबैलाई सम्पर्क गर्न-र त्यसैले त्यहाँ कुनै नमूना त्रुटि थिएन। धेरै शोधकर्ताहरू नमूना त्रुटिमा ध्यान केन्द्रित हुन्छन्- यो सामान्यतः एक प्रकारको त्रुटि हो जुन सर्वेक्षणमा रिपोर्ट गरिएको त्रुटिको मार्जिन द्वारा कब्जा गरिएको छ - तर साहित्यिक डाइजेस्टले हामीलाई सम्झाउँछ कि हामीलाई त्रुटिको सबै स्रोतहरू विचार गर्नुहोस्, अनियमित र व्यवस्थित दुवै।
अन्तमा, एक नमूना आबादी चयन गरे पछि, एक शोधकर्ताले कोसिस गर्ने प्रयास गरेको छ। ती व्यक्ति जो सफलतापूर्वक साक्षात्कार गरिएका छन् उत्तरदायी भनिन्छ। आदर्श रूपमा, नमूना आबादी र उत्तरदायीहरू उस्तै हुनेछन्, तर व्यवहारमा त्यहाँ कुनै जवाफ छैन। त्यो हो, जो लोग नमूना मा चयन गरिएको छ कहिलेकाहीं भाग लिन सक्दैनन्। यदि प्रतिक्रिया गर्ने व्यक्तिहरू प्रतिक्रिया नगर्नेहरूको फरक हो भने, त्यसपछि त्यहाँ गैरप्रणाली पूर्वाग्रह हुन सक्छ। साहित्यिक डाइजेस्ट पोलिसको साथ गैरप्रणाली पूर्वाधार दोस्रो मुख्य समस्या थियो। केवल 24% मतदान गर्ने व्यक्तिले मतदान गरे, र यसले ल्यान्डनलाई समर्थन गर्ने व्यक्तिलाई प्रतिक्रिया दिन अधिक सम्भव भए।
बस प्रतिनिधित्व को विचार परिचय एउटा उदाहरण रहेको परे, साहित्यिक डाइजेस्ट पोल haphazard नमूना खतराहरूबारे अनुसन्धानकर्ताहरूले cautioning, एक अक्सर-पटक दृष्टान्त छ। दुर्भाग्यवश, मलाई लाग््छ कि धेरै मान्छे यस कहानी देखि आकर्षित गर्न को लागि गलत छ। कथाको सबैभन्दा सामान्य नैतिक यो हो कि शोधकर्ताहरूले गैर सम्भावनात्मक नमूनाहरू (अर्थात् सहभागीहरू छनौट गर्न सख्त सम्भाव्यता आधारित नियम बिना नमूनाहरू) बाट केहि सिक्न सक्दैनन्। तर, जब म यस अध्यायमा पछि देखाउनेछु, त्यो ठिकै सही छैन। बरु, मलाई लाग्छ कि यस कथामा साँच्चै दुई नैतिकहरू छन्; नैतिकहरू आज सत्य हुन् जुन तिनीहरू 1 9 36 मा थिए। पहिलो, अकस्मातपूर्वक एकत्रित डेटाको एक ठूलो मात्राले राम्रो अनुमानको ग्यारेन्टी गर्दैन। सामान्यतया, ठूलो संख्यामा उत्तरदायीहरूले अनुमानहरूको भिन्नता घटाउँछन्, तर यसले आवश्यक रूपमा पूर्वाग्रह घटाउँदैन। धेरै डेटा संग, शोधकर्ताहरूले कहिलेकाहीँ गलत कुराको सटीक अनुमान प्राप्त गर्न सक्छन्; तिनीहरू सटीक हुन सक्छन् (McFarland and McFarland 2015) । साहित्यिक डाइजेस्ट अव्यवस्थितबाट दोस्रो मुख्य पाठ यो हो कि शोधकर्ताहरूले अनुमान लगाउँदा उनीहरूको नमूना एकत्र गरे कसरी खाता बनाउन आवश्यक छ। अन्य शब्दहरुमा, किनभने साहित्यिक डाइजेस्ट सर्वेक्षणमा नमूना प्रक्रियाले केही उत्तरदायीहरूको तर्फबाट प्रणालीगत रूपमा लुकाएको थियो, शोधकर्ताहरूले अझ जटिल जटिल अनुमान प्रक्रियाको प्रयोग गर्नुको साथै केही उत्तरदायीहरूलाई अरुभन्दा बढी वजनमा राखे। यस अध्यायमा पछि, म तपाईंलाई एक यस्तो वजन निर्धारण प्रक्रिया देखाउनेछु- पोस्ट-स्तरीकरण- जसले तपाईंलाई प्रभावकारी नमूनाहरूबाट अझ राम्रो अनुमान बनाउन सक्छ।