प्रतिनिधित्व आफ्नो लक्ष्य जनसंख्या आफ्नो उत्तरदाताओं देखि inferences बनाउने बारे छ।
ठूलो जनसंख्या गर्न उत्तरदाताओं देखि inferring गर्दा हुन सक्छ कि त्रुटिहरु प्रकारको बुझ्न गर्न, गरेको पनि 1936 अमेरिकी राष्ट्रपति चुनाव को नतिजा भविष्यवाणी गर्न खोज्दा कि साहित्य डाइजेस्ट पराल पोल विचार गरौं। यो 75 भन्दा बढी वर्ष पहिले थियो तापनि, यो debacle अझै पनि आज अनुसन्धानकर्ताहरूले सिकाउन एउटा महत्त्वपूर्ण पाठ छ।
साहित्यिक डाइजेस्ट एक लोकप्रिय सामान्य-ब्याज पत्रिका थियो, र 1920 मा सुरु तिनीहरू राष्ट्रपति चुनाव को परिणाम भविष्यवाणी गर्न पराल चुनाव चलिरहेको थाले। तिनीहरू केवल मान्छे धेरै गर्न मतपत्र पठाउन, थियो र त्यसपछि फिर्ता थिए कि मतपत्र अप Tally यी अनुमानहरू गर्न; साहित्य डाइजेस्ट गर्व उनि प्राप्त मतपत्र थिए न "।, भारित समायोजित, न त व्याख्या" यो प्रक्रिया सही विजेता भविष्यवाणी भनेर रिपोर्ट 1920, 1924, 1928 र 1932. 1936 मा मा चुनाव को, महान् अवसाद को बीचमा, साहित्य डाइजेस्ट बाहिर मतपत्र 10 लाख मान्छे जसको नाम predominately टेलिफोन निर्देशिका र सवारीसाधान दर्ता रेकर्ड आए, पठाइयो। यहाँ तिनीहरूले पद्धति वर्णन कसरी गर्ने:
"कडा परिश्रम तथ्य गर्न guesswork कम गर्न तीस वर्ष को अनुभव को तेज सटीक संग पचाउन गरेको चिल्लो-चलिरहेको मिसिन चाल। । । .यो हप्ता 500 कलम थप एक दिन एक लाख ठेगाना को एक चौथाई भन्दा बाहिर scratched। हरेक दिन, एक ठूलो कोठा माथि मोटर-काटने निशानवाला चौथो एवेन्यू उच्च, न्यूयोर्क मा मा, 400 कार्यकर्ता deftly कुरा-पर्याप्त चालीस शहर ब्लक-मा सम्बोधन envelops [प्रकार] प्रशस्त गर्न मुद्रित को एक लाख टुक्रा स्लाइड गर्नुहोस्। हरेक घंटा, पचाउन आफ्नै डाक सबस्टेसन मा, तीन chattering postage मिटरिङ्ग मिसिन छाप र सेतो oblongs stamped; कुशल हुलाक कर्मचारीहरु mailsacks उभडा मा उनलाई फ्लिप; छिटो पचाउन ट्रक तिनीहरूलाई मेल-गाडिहरु व्यक्त गर्न उड। । । अर्को हप्ता, यी दस लाख देखि पहिलो जवाफ तीन-जाँच, क्रस-वर्गीकृत पाँच-पटक प्रमाणित र totaled हुन, चिह्नित मतपत्र को आगमन ज्वारभाटा सुरु हुनेछ। पछिल्लो आंकडा totted गरिएको छ र जाँच, पछिल्लो अनुभव एक मापदण्ड हो भने, देश 1 प्रतिशत चालीस लाख [मतदाता] वास्तविक लोकप्रिय मत को एक अंश भित्र थाहा हुनेछ। "(अगस्ट 22, 1936)
आकार को डाइजेस्ट गरेको fetishization आज कुनै पनि "ठूलो डाटा" शोधकर्ता तत्काल चिन्न छ। 10 लाख मतपत्र वितरण को, एउटा अचम्मको 2.4 मिलियन मतपत्र फर्के-कि थिए लगभग 1,000 पटक ठूलो आधुनिक राजनीतिक पोल भन्दा छ। यी 2.4 मिलियन उत्तरदाताओं देखि जूरीको फैसला स्पष्ट थियो: साहित्य डाइजेस्ट को चुनौती Alf Landon को incumbent फ्रेंकलिन रूजवेल्ट पराजित गर्न लाग्नुभएको थियो कि भविष्यवाणी। तर, वास्तवमा, दुरुस्त विपरीत भयो। रूजवेल्ट एक पहिरो मा Landon पराजित। साहित्य डाइजेस्ट कसरी यति डाटा गलत जान सक्छ? नमूना हाम्रो आधुनिक समझ साहित्य डाइजेस्ट गरेको त्रुटिहरू स्पष्ट बनाउँछ र हामीलाई पनि त्यस्तै त्रुटिहरू बनाउन भविष्यमा जोगिन मद्दत गर्छ।
नमूना बारेमा स्पष्ट सोच हामीलाई मान्छे को चार विभिन्न समूह (चित्रा 3.1) विचार गर्न आवश्यक छ। मान्छे को पहिलो समूह लक्षित जनसंख्या छ; यो अनुसन्धान चासो को जनसंख्या रूपमा परिभाषित गर्ने समूह छ। साहित्य डाइजेस्ट को मामला मा लक्षित जनसंख्या भएको 1936 राष्ट्रपति निर्वाचनमा मतदाता थियो। एक लक्ष्य जनसंख्या निर्णय गरेपछि एक शोधकर्ता अर्को नमूना लागि प्रयोग गर्न सकिन्छ भन्ने मानिसहरूको सूची विकास गर्न आवश्यक छ। यो सूची एक नमूना फ्रेम भनिन्छ र नमूना फ्रेम मा जनसंख्या फ्रेम जनसंख्या भनिन्छ। साहित्य डाइजेस्ट को मामला मा फ्रेम जनसंख्या 10 लाख मान्छे जसको नाम टेलिफोन निर्देशिका र सवारीसाधान दर्ता रेकर्ड देखि predominately आयो। आदर्श लक्ष्य जनसंख्या र फ्रेम जनसंख्या बिल्कुल नै हुनेछ, तर व्यवहार मा यो छैन मामला अक्सर छ। लक्षित जनसंख्या र फ्रेम जनसंख्या बीच मतभेद कवरेज त्रुटि भनिन्छ। कवरेज त्रुटि छैन, समस्या आफैमा ग्यारेन्टी गर्दैन। तर, फ्रेम जनसंख्या मानिसहरूको मान्छे देखि प्रणालीबद्ध भिन्न छन् भने फ्रेम जनसंख्या त्यहाँ कवरेज पूर्वाग्रह हुनेछ। कवरेज त्रुटि साहित्य डाइजेस्ट पोल संग प्रमुख कमजोरीको पहिलो थियो। तिनीहरूले मतदाता-थियो सिक्न चाहन्थे आफ्नो लक्ष्य जनसंख्या-तर तिनीहरूले टेलिफोन निर्देशिका र सवारीसाधान Registries, स्रोतबाट predominately एक नमूना फ्रेम निर्माण wealthier भन्दा-प्रतिनिधित्व गर्ने अमेरिकी यी प्रविधिहरू दुवै भनेर Alf Landon (सम्झन्छन् समर्थन बढी सम्भावना थिए, जो साधारण आज, समय मा र अमेरिकी महान् अवसाद को बीचमा थियो) अपेक्षाकृत नयाँ थिए।
फ्रेम जनसंख्या परिभाषित पछि, अर्को चरण नमूना जनसंख्या चयन गर्न एक शोधकर्ता लागि हो; यी कि शोधकर्ता साक्षात्कार गर्न प्रयास गर्नेछ मानिसहरू हुन्। नमूना फ्रेम जनसंख्या भन्दा फरक विशेषताहरु छ भने, त्यसपछि हामी नमूना त्रुटि परिचय गर्न सक्नुहुन्छ। यो सामान्यतया अनुमान सँगसँगै भनेर त्रुटि को मार्जिन मा quantified त्रुटि को प्रकारको छ। साहित्यिक डाइजेस्ट fiasco को मामला मा त्यहाँ वास्तवमा कुनै नमूना थियो; तिनीहरूले फ्रेम जनसंख्या सबैलाई सम्पर्क गर्ने प्रयास गर्यो। तापनि कुनै नमूना त्रुटि थियो, त्यहाँ स्पष्ट अझै पनि त्रुटि थियो। यो कि सामान्यतया सर्वेक्षण देखि अनुमान संग रिपोर्ट छन् त्रुटिहरू को मार्जिन सामान्यतया misleadingly सानो हो कि clarifies; तिनीहरूले त्रुटि सबै स्रोतहरू समावेश छैन।
अन्तमा, एक शोधकर्ता नमूना जनसंख्या सबैलाई साक्षात्कार गर्ने प्रयासहरू। सफलतापूर्वक अन्तरवार्ता छन् कि ती मानिसहरूले उत्तरदाताओं भनिन्छ। आदर्श, नमूना जनसंख्या र उत्तरदाताओं बिल्कुल नै हुनेछ, तर व्यवहार मा त्यहाँ गैर-प्रतिक्रिया छ। त्यो नमूनामा चयन गरिएका छन् जो मानिसहरू सहभागी इन्कार छ। जो प्रतिक्रिया मानिसहरूलाई प्रतिक्रिया नगर्ने ती फरक छन् भने, त्यसपछि त्यहाँ गैर-प्रतिक्रिया पूर्वाग्रह हुन सक्छ। गैर-प्रतिक्रिया पूर्वाग्रह साहित्यिक डाइजेस्ट पोल संग दोस्रो मुख्य समस्या थियो। एक मतपत्र प्राप्त गर्ने मान्छे को% मात्र 24 प्रतिक्रिया, र यो Landon समर्थित मानिसहरू प्रतिक्रिया सम्भावना बढी थिए बाहिर गरियो।
बस प्रतिनिधित्व को विचार परिचय एउटा उदाहरण रहेको परे, साहित्यिक डाइजेस्ट पोल haphazard नमूना खतराहरूबारे अनुसन्धानकर्ताहरूले cautioning, एक अक्सर-पटक दृष्टान्त छ। दुर्भाग्यवश, म धेरै मानिसहरू यस कथाबाट आकर्षित कि पाठ गलत छ भन्ने सोच्छन्। कथा को सबै भन्दा साधारण नैतिक अनुसन्धानकर्ताहरूले (सहभागीहरू चयन लागि सख्त सम्भावना आधारित नियम बिना अर्थात्, नमूनाहरू) गैर-सम्भावना नमूनाहरू देखि केहि सिक्न सक्दैन छ। तर, म यो अध्याय पछि देखाउने छौँ रूपमा, कि छैन एकदम सही हो। बरु, म त्यहाँ साँच्चै यो कथा दुई नैतिकता छन् लाग्छ; तिनीहरूले 1936. पहिलो थिए रूपमा साँचो आज हो कि नैतिकता, इत्तफाक से संकलित डेटा को ठूलो रकम राम्रो अनुमान ग्यारेन्टी छैन। दोस्रो, अनुसन्धानकर्ताहरूले तिनीहरूले देखि अनुमान गर्दै गर्दा आफ्नो डाटा संकलन भएको थियो कसरी लागि खाता गर्न आवश्यक छ। अर्को शब्दमा, साहित्यिक डाइजेस्ट पोल मा डाटा संग्रह प्रक्रिया प्रणालीबद्ध केही उत्तरदाताओं तिर skewed थियो किनभने, अनुसन्धानकर्ताहरूले अरूलाई भन्दा कि वजन केही उत्तरदाताओं थप एक जटिल अनुमान प्रक्रिया प्रयोग गर्न आवश्यक छ। यस अध्यायमा पछि, म तपाईंलाई एक यस्तो भार प्रक्रिया-पोस्ट-स्तरीकरण-गैर-सम्भावना नमूनाहरू संग राम्रो अनुमान गर्न तपाईं सक्षम पार्न सक्नुहुन्छ देखाउने छौँ।