लोकप्रतिनिधी आपले लक्ष्य लोकसंख्या आपल्या सर्वेक्षणात पासून निश्चितच बनवण्यासाठी बद्दल आहे.
मोठ्या लोकसंख्येतील उत्तरप्रेमींकडे प्रवेश करताना ज्या प्रकारच्या चुका होऊ शकतात त्या समजून घेण्यासाठी लिटरेरी डाइजेस्ट स्ट्रॉ पोल म्हणजे 1 9 36 च्या अमेरिकेच्या राष्ट्रपतिपदाच्या निवडणुकीचा निकाल सांगण्याचा प्रयत्न केला. हे 75 वर्षांपूर्वी घडले असले तरीही, आज या पराभवाचा अभ्यास आजही संशोधकांना शिकवण्यासाठी एक महत्त्वाचा धडा आहे.
लिटररी डाइजेस्ट हे लोकप्रिय सर्वसाधारण स्वारस्य पत्रिका होते आणि 1 9 20 मध्ये ते सुरुवातीला ते राष्ट्रपती निवडणुकीच्या निकालांचे अनुमान काढण्यासाठी पेंचरच्या निवडणूकीस सुरुवात करू लागले. हे अंदाज तयार करण्यासाठी, ते बरेच लोकंना मतपत्रिका पाठवतात आणि परत मिळालेल्या मतपत्रिकांची संख्या मोजण्यासाठी करतात; लिटररी डायजेस्टने अभिमानाने सांगितले की, त्यांनी प्राप्त केलेले मतपत्रे "भारित केलेले, समायोजित केलेले, किंवा अर्थ लावले नाहीत." ही पद्धत 1 9 20, 1 9 24, 1 9 28 आणि 1 9 32 च्या निवडणुकीच्या विजेत्यांची अचूक भाकीत करण्यात आली. 1 9 36 साली ग्रेट डिप्रेशन, लिटररी डायजेस्टने 10 दशलक्ष लोकांना मतपत्रिका पाठविली, ज्यांची नावे प्रामुख्याने टेलिफोन डायरेक्टरीज आणि ऑटोमोबाईल रजिस्ट्रेशन रेकॉर्ड्समधून झाली आहेत. त्यांनी त्यांच्या पद्धतींचे वर्णन कसे केले आहे ते येथे आहे:
"डुग्रेस्टची सुरळीत चालणारी मशीन हार्ड तथ्यांच्या बरोबरीने गहाळखोरी कमी करण्यासाठी तीस वर्षांचा अनुभव वेगाने पुढे चालत आहे ... या आठवड्यात 500 पेन एक दिवसाच्या एक चतुर्थांश पेक्षा अधिक दिवस बाहेर पडले. दररोज, न्यूयॉर्कमधील चौथ्या अव्हेन्यूच्या वर असलेल्या एका मोठ्या खोलीत, 400 कर्मचारी चतुराईने एक दशलक्ष तुकडे मुद्रित करतात- चाळीस शहरांच्या ब्लॉकला जाण्यासाठी पुरेसा-संबोधित लिफाफ्यात [एसआयसी]. दर तास, डीआयजीएसआर मधील स्वतःचे पोस्ट ऑफिस सबस्टेशनमध्ये, तीन गोंधळलेल्या टपालखर्च मीटरने मोजण्याचे मशीन सीलबंद आणि पांढऱ्या रंगाच्या पेट्या मुद्रांकित केले; कुशल पोस्टल कर्मचार्यांना मेलस्केम गोळा करण्याच्या प्रयत्नात होते; फ्लायॅट डीआयजीएसटी ट्रकने त्यांना मेल-ट्रेन एक्सप्रेस करण्यास सांगितले . . पुढील आठवड्यात, या दहा दशलक्षांपासूनचे पहिले उत्तर चिन्हांकित मतपत्रिकांपैकी येणारे ज्वलन सुरू करेल, तिप्पट-तपासले, सत्यापित, पाच-वेळा क्रॉस-वर्गीकृत केले जाईल आणि एकूण केले जाईल. गेल्या आकृतीच्या अदलाबदल आणि तपासले गेल्यावर, जर भूतकाळाचा अनुभव हा निकष असेल तर देश 1 टक्क्यामध्ये 40 लाख मतदारांच्या वास्तविक लोकप्रिय मतदाराला कळेल. "(ऑगस्ट 22, 1 9 36)
साहित्यिक डाइजेस्टचे आकारमान हे आजच्या कोणत्याही "मोठ्या डेटा" संशोधकांना त्वरित ओळखता येण्याजोगे आहे. 10 दशलक्ष मतपत्रिका वितरित करण्यात आल्या तर 2.4 लाख रूपये परत आले - म्हणजे आधुनिक राजकीय निवडणुकीपेक्षा ते जवळपास 1,000 पटीने मोठे होते. या 2.4 दशलक्ष लोकांनी उत्तर दिले, की आल्फे लॅंडन कायम फ्रॅंकलिन रुझवेल्ट यांना पराभूत करेल. परंतु प्रत्यक्षात रूझवेल्टने एका प्रचंड भूभागात लाँडनचा पराभव केला. साहित्यिक डाइजेस्ट इतके डेटासह चुकीचे कसे जायचे? आमच्या नमूनाबद्दलची आधुनिक समज साहित्यिक डाइजेस्टची चूक स्पष्ट करते आणि भविष्यात अशाच चुका करणे टाळण्यात आम्हाला मदत करते.
सॅम्पलिंगबद्दल स्पष्टपणे विचार केल्याने आपल्याला चार वेगवेगळ्या गटांना (चित्रा 3.2) विचार करावा लागतो. पहिला गट लक्ष्य लोकसंख्या आहे ; हा गट ज्या संशोधक व्याजांची लोकसंख्या म्हणून स्पष्ट करतो. साहित्यिक डाइजेस्टच्या बाबतीत, लक्ष्य लोकसंख्या 1 9 36 च्या राष्ट्रपती निवडणुकीत मतदार होते.
लक्ष्यित लोकसंख्येवर निर्णय घेतांना, संशोधकांना अशा लोकांची यादी तयार करणे आवश्यक आहे जे सॅम्पलिंगसाठी वापरले जाऊ शकते. या यादीला एक नमूना फ्रेम असे म्हणतात आणि त्यावर असलेल्या लोकांना फ्रेम लोकसंख्या म्हणतात. आदर्शपणे, लक्ष्य लोकसंख्या आणि फ्रेम लोकसंख्या त्याच होईल, पण सराव मध्ये हे सहसा बाबतीत नाही. उदाहरणार्थ, साहित्यिक डाइजेस्टच्या बाबतीत, फ्रेमची लोकसंख्या 1 कोटी होती ज्यांची नावे टेलिफोन डायरेक्टरीज आणि ऑटोमोबाईल रजिस्ट्रेशन रेकॉर्ड्समधून प्रामुख्याने आली होती. लक्ष्य लोकसंख्या आणि फ्रेम लोकसंख्या दरम्यान फरक कव्हरेज त्रुटी म्हणतात कव्हरेज एरर, स्वतःच नाही, गॅरंटीच्या समस्या. तथापि, फ्रेम लोकसंख्येतील लोक लक्ष्यबद्ध लोकसंख्येतील लोकांपासून व्यवस्थितपणे वेगळे असतील तर ते कव्हरेज पूर्वाग्रह होऊ शकतात जे फ्रेम लोकसंख्या नसतात. हे खरे आहे, लिटरेरी डाइजेस्ट पोलमध्ये नेमके काय झाले. त्यांच्या फ्रेम लोकसंख्येतील लोक अॅल्फ लॅन्डनला सहाय्य देण्याची अधिक शक्यता असल्याचे भासते कारण ते समृद्ध होते (1 9 36 मध्ये टेलिफोन आणि ऑटोमोबाइल दोन्ही तुलनेने नवीन आणि महाग होते हे आठवणे). तर, साहित्यिक डाइजेस्ट मतदानानुसार, कव्हरेज त्रुटीमुळे कव्हरेज बायस झाला.
फ्रेम लोकसंख्या परिभाषित केल्यानंतर, पुढील पायरी म्हणजे संशोधकाने नमुना लोकसंख्या निवडणे; हे हे लोक आहेत जे संशोधक मुलाखत घेण्याचा प्रयत्न करतील. जर नमुनामध्ये फ्रेम लोकसंख्या पेक्षा भिन्न वैशिष्ट्ये आहेत, तर नमूनाकरण नमूनास त्रुटी सांगू शकते. साहित्यिक डाइजेस्ट फज्काराच्या बाबतीत, फ्रेमोग्राफमध्ये प्रत्येकाशी संपर्क साधण्यासाठी मॅगझिन प्रत्यक्षात साजरा करण्यात आला नाही- आणि म्हणून तेथे कोणतीही नमूना चूक झाली नाही. अनेक संशोधक सॅम्पलिंग एररवर लक्ष केंद्रित करतात- सर्वेक्षणात केलेल्या त्रुटींच्या मार्जिनने मिळविलेले हे एकमात्र प्रकारचे त्रुटी आहे परंतु साहित्यिक डाइजेस्ट फियास्कओ आपल्याला याची आठवण करून देतो की आपल्याला यादृच्छिक आणि व्यवस्थित दोन्ही त्रुटींच्या स्त्रोतांवर विचार करणे आवश्यक आहे.
अखेरीस, एक नमुना लोकसंख्या निवडून घेतल्यानंतर, एक संशोधक त्याच्या सर्व सदस्यांना मुलाखत करण्याचा प्रयत्न करतो. यशस्वीरित्या मुलाखत घेतलेले लोक उत्तरदायी आहेत . आदर्शपणे, नमुना लोकसंख्या आणि उत्तरदायित्वाचे तंतोतंत असतील, परंतु सराव मध्ये गैर-प्रतिक्रिया आहे. म्हणजेच, जे लोक नमुना मध्ये निवडले जातात ते सहसा सहभागी होत नाहीत. जे लोक प्रतिसाद देतात त्यांच्यापेक्षा वेगळं असतं तर ते उत्तरदायी नसतील. साहित्यिक डाइजेस्ट मतदान सह गैरप्रकार पूर्वाग्रह दुसरी मुख्य समस्या होती केवळ 24% लोकांना मतपत्रिका प्राप्त झाली, आणि हे स्पष्ट झाले की लँडनला पाठिंबा देणार्या लोकांना प्रतिसाद देण्याची अधिक शक्यता होती.
केवळ प्रतिनिधित्वाच्या कल्पनांचा परिचय करून देण्यासाठी उदाहरण म्हणून, लिटरेरी डाइजेस्ट मतदान हे बर्याचदा परावर्तित आहे, अनियमित नमूनांचे धोक्यांविषयी संशोधकांना ताकीद देते. दुर्दैवाने, मला वाटते की या कथेवरून अनेक लोक जे पाठवतात ते चुकीचे आहे. कथा सर्वात सामान्य नैतिक आहे की संशोधक गैर-संभाव्यतेच्या नमुने (उदा. भागधारक निवडण्याबाबत सखोलता-आधारित नियमांशिवाय नमुने) काही शिकू शकत नाहीत. पण, मी या प्रकरणात नंतर दाखवल्याप्रमाणे, हे अगदी योग्य नाही. त्याऐवजी, मला वाटते की या कथेसाठी खरोखर दोन नैतिक मूल्ये आहेत; 1 9 36 मध्ये ते आज जसे खरे आहेत, त्याचप्रमाणे नैतिकता. प्रथम, अफाटपणे एकत्रित केलेल्या डेटामुळे मोठ्या प्रमाणातील अंदाज निश्चित होणार नाही. सर्वसाधारणपणे, मोठ्या संख्येने उत्तरदायित्व असणार्या अंदाजांमधील फरक कमी होतात, परंतु पूर्वाभिमुखता कमी होत नाही. बरेच डेटा सह, संशोधक काहीवेळा चुकीच्या गोष्टीचे अचूक अंदाज मिळवू शकतात; ते तंतोतंत चुकीचे असू शकतात (McFarland and McFarland 2015) . लिटररी डाइजेस्ट फियास्कोचा दुसरा मुख्य धडा म्हणजे अंदाज तयार करताना संशोधकांनी त्यांचे नमुना कसे संग्रहित केले याचे सर्वेक्षण करणे आवश्यक आहे. दुसऱ्या शब्दांत सांगायचे तर लिटरेरी डाइजेस्ट मतदानात नमूना प्रक्रिया काही प्रतिसादकर्त्यांकडे पद्धतशीरपणे वळली गेली होती, संशोधकांना अधिक जटिल अंदाज प्रक्रियेचा वापर करणे आवश्यक होते ज्यात काही उत्तरदायी इतरांपेक्षा अधिक भारित होते. नंतर या प्रकरणात, मी तुम्हाला अशा एक महत्त्वपूर्ण कार्य-प्रक्रिया-पोस्ट-स्तरीकरण दाखवू शकेन - ते आपल्याला आकस्मिकपणे नमुन्यांपासून चांगले अंदाज तयार करण्यास सक्षम करते.