इस अध्याय में कई विषयों को अमेरिकन एसोसिएशन ऑफ पब्लिक ओपिनियन रिसर्च (एएपीओआर) में हालिया राष्ट्रपति पदों में भी प्रतिबिंबित किया गया है, जैसे कि Dillman (2002) , Newport (2011) , Santos (2014) , और Link (2015) ।
सर्वेक्षण अनुसंधान और गहन साक्षात्कार के बीच मतभेदों के बारे में अधिक जानकारी के लिए, Small (2009) । गहन साक्षात्कार से संबंधित नृवंशविज्ञान नामक दृष्टिकोणों का एक परिवार है। नृवंशविज्ञान अनुसंधान में, शोधकर्ता आमतौर पर प्रतिभागियों के साथ अपने प्राकृतिक पर्यावरण में अधिक समय बिताते हैं। नृवंशविज्ञान और गहन साक्षात्कार के बीच मतभेदों के बारे में अधिक जानकारी के लिए, Jerolmack and Khan (2014) । डिजिटल नृवंशविज्ञान पर अधिक जानकारी के लिए, Pink et al. (2015) देखें Pink et al. (2015) ।
सर्वे शोध के इतिहास का मेरा विवरण बहुत रोमांचक घटनाओं को शामिल करने के लिए बहुत संक्षिप्त है। अधिक ऐतिहासिक पृष्ठभूमि के लिए, Smith (1976) , Converse (1987) , और Igo (2008) । सर्वे शोध के तीन युग के विचार पर, Groves (2011) और Dillman, Smyth, and Christian (2008) (जो तीन युगों को थोड़ा अलग करता है)।
Groves and Kahn (1979) आमने-सामने और टेलीफोन सर्वेक्षण के बीच एक विस्तृत सिर-टू-हेड तुलना करके सर्वेक्षण अनुसंधान में पहले से दूसरे युग में संक्रमण के अंदर एक झलक पेश करते हैं। ( ??? ) यादृच्छिक-अंक-डायलिंग नमूनाकरण विधियों के ऐतिहासिक विकास पर वापस देखो।
समाज में बदलावों के जवाब में अतीत में सर्वेक्षण अनुसंधान कैसे बदल गया है, इसके लिए Tourangeau (2004) , ( ??? ) , और Couper (2011) ।
पूछने और निरीक्षण करने की शक्तियों और कमजोरियों पर मनोवैज्ञानिकों (जैसे, Baumeister, Vohs, and Funder (2007) ) और समाजशास्त्रियों (जैसे, Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) ; Jerolmack and Khan (2014) ]। पूछने और देखने के बीच का अंतर अर्थशास्त्र में भी उभरता है, जहां शोधकर्ताओं ने कहा और वरीयताओं के बारे में बात की। उदाहरण के लिए, एक शोधकर्ता उत्तरदाताओं से पूछ सकता है कि क्या वे आइसक्रीम खा रहे हैं या जिम जा रहे हैं (वरीयताओं को बताया गया), या देख सकता है कि लोग कितनी बार आइसक्रीम खाते हैं और जिम (प्रकट वरीयताओं) पर जाते हैं। Hausman (2012) में वर्णित अर्थशास्त्र में कुछ प्रकार के निर्दिष्ट प्राथमिकता डेटा के बारे में गहरी संदेह है।
इन बहसों से एक मुख्य विषय यह है कि रिपोर्ट किया गया व्यवहार हमेशा सटीक नहीं होता है। लेकिन, जैसा कि अध्याय 2 में वर्णित किया गया था, बड़े डेटा स्रोत सटीक नहीं हो सकते हैं, वे ब्याज के नमूने पर एकत्र नहीं किए जा सकते हैं, और वे शोधकर्ताओं तक पहुंच योग्य नहीं हो सकते हैं। इस प्रकार, मुझे लगता है कि, कुछ परिस्थितियों में, रिपोर्ट किए गए व्यवहार उपयोगी हो सकते हैं। इसके अलावा, इन बहसों का एक दूसरा मुख्य विषय यह है कि भावनाओं, ज्ञान, अपेक्षाओं और विचारों के बारे में रिपोर्ट हमेशा सटीक नहीं होती है। लेकिन, अगर शोधकर्ताओं द्वारा इन आंतरिक राज्यों के बारे में जानकारी की आवश्यकता होती है- या तो कुछ व्यवहार की व्याख्या करने या चीज़ को समझाए जाने के लिए-तो पूछना उचित हो सकता है। बेशक, प्रश्न पूछकर आंतरिक राज्यों के बारे में सीखना समस्याग्रस्त हो सकता है क्योंकि कभी-कभी उत्तरदाताओं को अपने आंतरिक राज्यों (Nisbett and Wilson 1977) अवगत नहीं हैं।
Groves (2004) का अध्याय 1 सर्वेक्षण सर्वेक्षणकर्ताओं द्वारा कुल सर्वेक्षण त्रुटि ढांचे का वर्णन करने के लिए कभी-कभी असंगत शब्दावली को सुलझाने का उत्कृष्ट काम करता है। कुल सर्वेक्षण त्रुटि ढांचे के एक पुस्तक-लंबाई उपचार के लिए, Groves et al. (2009) , और एक ऐतिहासिक अवलोकन के लिए, Groves and Lyberg (2010) ।
पूर्वाग्रह और भिन्नता में त्रुटियों को विघटित करने का विचार मशीन सीखने में भी आता है; उदाहरण के लिए, Hastie, Tibshirani, and Friedman (2009) धारा 7.3 देखें। यह अक्सर शोधकर्ताओं को "पूर्वाग्रह-भिन्नता" व्यापार-बंद के बारे में बात करने की ओर ले जाता है।
प्रतिनिधित्व के संदर्भ में, गैर-प्रतिक्रिया और गैर-प्रतिक्रिया पूर्वाग्रह के मुद्दों के लिए एक महान परिचय राष्ट्रीय विज्ञान परिषद की रिपोर्ट सामाजिक विज्ञान सर्वेक्षण में गैर-प्रतिक्रिया है: एक शोध एजेंडा (2013) । Groves (2006) द्वारा एक और उपयोगी अवलोकन प्रदान किया जाता है। इसके अलावा, जर्नल ऑफ आधिकारिक सांख्यिकी , लोक राय तिमाही , और अमेरिकन एकेडमी ऑफ पॉलिटिकल एंड सोशल साइंस के इतिहास के सभी विशेष मुद्दों को गैर प्रतिक्रिया के विषय पर प्रकाशित किया गया है। अंत में, प्रतिक्रिया दर की गणना करने के वास्तव में कई अलग-अलग तरीके हैं; द अमेरिकन एसोसिएशन ऑफ पब्लिक ओपिनियन रिसर्चर्स (एएपीओआर) ( ??? ) द्वारा एक रिपोर्ट में इन दृष्टिकोणों का विस्तार से वर्णन किया गया है।
1 9 36 साहित्यिक डाइजेस्ट सर्वेक्षण पर अधिक जानकारी के लिए, Cahalan (1989) Bryson (1976) , Squire (1988) , Cahalan (1989) , और Lusinchi (2012) । खतरनाक डेटा संग्रह के खिलाफ एक दृष्टांत चेतावनी के रूप में इस सर्वेक्षण की एक और चर्चा के लिए, Gayo-Avello (2011) । 1 9 36 में, जॉर्ज गैलुप ने नमूना के एक अधिक परिष्कृत रूप का उपयोग किया और बहुत छोटे नमूने के साथ अधिक सटीक अनुमान उत्पन्न करने में सक्षम था। साहित्यिक डाइजेस्ट पर गैलप की सफलता सर्वेक्षण शोध के विकास में एक मील का पत्थर था जैसा कि @ converse_survey_1987 के अध्याय 3 में वर्णित है; Ohmer (2006) अध्याय 4 Ohmer (2006) ; और @ igo_averaged_2008 का अध्याय 3।
मापन के मामले में, प्रश्नावली डिजाइन करने के लिए एक महान पहला संसाधन Bradburn, Sudman, and Wansink (2004) । अधिक उन्नत उपचार के लिए, Schuman and Presser (1996) , जो विशेष रूप से रवैये के प्रश्नों पर केंद्रित है, और Saris and Gallhofer (2014) , जो अधिक सामान्य है। मापने के लिए थोड़ा अलग दृष्टिकोण मनोचिकित्सा में लिया जाता है, जैसा कि वर्णन किया गया है ( ??? ) । प्रीटेस्टिंग पर अधिक Presser and Blair (1994) , Presser et al. (2004) , और Groves et al. (2009) अध्याय 8 Groves et al. (2009) । सर्वेक्षण प्रयोगों के लिए, Mutz (2011) ।
लागत के संदर्भ में, सर्वेक्षण लागत और सर्वेक्षण त्रुटियों के बीच व्यापार-बंद के क्लासिक, पुस्तक-लंबाई उपचार Groves (2004) ।
मानक संभाव्यता नमूनाकरण और आकलन के दो क्लासिक पुस्तक-लंबाई उपचार Lohr (2009) (अधिक प्रारंभिक) और Särndal, Swensson, and Wretman (2003) (अधिक उन्नत) हैं। पोस्ट-स्तरीकरण और संबंधित तरीकों का एक क्लासिक पुस्तक-लंबाई उपचार Särndal and Lundström (2005) । कुछ डिजिटल-आयु सेटिंग्स में, शोधकर्ताओं को गैर-संवाददाताओं के बारे में बहुत कुछ पता है, जो अतीत में अक्सर सच नहीं था। गैर-प्रतिक्रिया समायोजन के विभिन्न रूप संभव हैं जब शोधकर्ताओं के पास Kalton and Flores-Cervantes (2003) और Smith (2011) द्वारा वर्णित गैर-संवाददाताओं के बारे में जानकारी है।
W. Wang et al. (2015) द्वारा एक्सबॉक्स अध्ययन W. Wang et al. (2015) मल्टीलेवल रिग्रेशन और पोस्ट-स्ट्रैटिफिकेशन ("श्री पी।") नामक एक तकनीक का उपयोग करता है जो शोधकर्ताओं को समूह के साधनों का अनुमान लगाने की अनुमति देता है, भले ही कई समूह हैं। यद्यपि इस तकनीक के अनुमानों की गुणवत्ता के बारे में कुछ बहस है, लेकिन यह पता लगाने के लिए एक आशाजनक क्षेत्र की तरह लगता है। इस तकनीक का पहली बार Park, Gelman, and Bafumi (2004) में उपयोग किया गया था, और इसके बाद के उपयोग और बहस (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) । व्यक्तिगत वजन और समूह के वजन के बीच संबंधों के लिए, Gelman (2007) ।
वेब सर्वेक्षण भारित करने के अन्य दृष्टिकोणों के लिए, Schonlau et al. (2009) देखें Schonlau et al. (2009) , Bethlehem (2010) , और Valliant and Dever (2011) । ऑनलाइन पैनल या तो संभाव्य नमूनाकरण या गैर-संभाव्यता नमूनाकरण का उपयोग कर सकते हैं। ऑनलाइन पैनलों पर अधिक के लिए, Callegaro et al. (2014) देखें Callegaro et al. (2014) ।
कभी-कभी, शोधकर्ताओं ने पाया है कि संभाव्यता के नमूने और गैर-संभाव्यता के नमूने समान गुणवत्ता (Ansolabehere and Schaffner 2014) अनुमान उत्पन्न करते हैं, लेकिन अन्य तुलनाओं से पता चला है कि गैर-संभाव्यता के नमूने खराब होते हैं (Malhotra and Krosnick 2007; Yeager et al. 2011) । इन मतभेदों का एक संभावित कारण यह है कि समय के साथ गैर-संभाव्यता के नमूने में सुधार हुआ है। गैर-संभाव्यता नमूनाकरण विधियों के अधिक निराशावादी दृष्टिकोण के लिए गैर-संभाव्यता नमूनाकरण (Baker et al. 2013) पर एपोर टास्क फोर्स देखें, और मैं सारांश रिपोर्ट का पालन करने वाली टिप्पणी को पढ़ने की भी सिफारिश करता हूं।
Conrad and Schober (2008) भविष्य में सर्वेक्षण साक्षात्कार के एविजनिंग नामक एक संपादित मात्रा है, और यह प्रश्न पूछने के भविष्य के बारे में विभिन्न दृष्टिकोण प्रदान करता है। Couper (2011) समान विषयों को संबोधित करता है, और Schober et al. (2015) एक अच्छा उदाहरण प्रदान करता है कि एक नई सेटिंग के अनुरूप डेटा संग्रह विधियों के परिणामस्वरूप उच्च गुणवत्ता वाले डेटा हो सकते हैं। Schober and Conrad (2015) समाज में बदलावों के मिलान के लिए सर्वेक्षण अनुसंधान की प्रक्रिया को समायोजित करने के बारे में एक और सामान्य तर्क प्रदान करते हैं।
Tourangeau and Yan (2007) संवेदनशील प्रश्नों में सामाजिक वांछनीयता पूर्वाग्रह के मुद्दों, और Lind et al. (2013) कुछ संभावित कारण प्रदान करते हैं कि क्यों लोग कंप्यूटर-प्रशासित साक्षात्कार में अधिक संवेदनशील जानकारी का खुलासा कर सकते हैं। सर्वे में भागीदारी दरों में वृद्धि में मानव साक्षात्कारकर्ताओं की भूमिका पर अधिक जानकारी के लिए, Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , और Schaeffer et al. (2013) । मिश्रित मोड सर्वेक्षणों के लिए, Dillman, Smyth, and Christian (2014) ।
Stone et al. (2007) पारिस्थितिकीय क्षणिक मूल्यांकन और संबंधित तरीकों के एक पुस्तक-लंबाई उपचार की पेशकश करते हैं।
सर्वेक्षणों को प्रतिभागियों के लिए एक सुखद और मूल्यवान अनुभव बनाने के बारे में अधिक सलाह के लिए, टेलर डिज़ाइन विधि (Dillman, Smyth, and Christian 2014) पर काम देखें। सामाजिक विज्ञान सर्वेक्षण के लिए फेसबुक ऐप्स का उपयोग करने के एक और दिलचस्प उदाहरण के लिए, Bail (2015) ।
Judson (2007) सर्वेक्षण और प्रशासनिक डेटा को "सूचना एकीकरण" के रूप में जोड़ने की प्रक्रिया का वर्णन करता है और इस दृष्टिकोण के कुछ फायदों पर चर्चा करता है, साथ ही कुछ उदाहरण पेश करता है।
समृद्ध पूछने के बारे में, वोटिंग को सत्यापित करने के कई पिछले प्रयास हुए हैं। उस साहित्य के एक सिंहावलोकन के लिए, Belli et al. (1999) देखें Belli et al. (1999) , Ansolabehere and Hersh (2012) Belli et al. (1999) , Ansolabehere and Hersh (2012) Hanmer, Banks, and White (2014) , और Berent, Krosnick, and Lupia (2016) । Ansolabehere and Hersh (2012) में प्रस्तुत परिणामों के बारे में अधिक संदेहजनक दृष्टिकोण के लिए Berent, Krosnick, and Lupia (2016) देखें।
यह ध्यान रखना महत्वपूर्ण है कि यद्यपि Ansolabehere और Hersh को कैटलिस्ट से डेटा की गुणवत्ता से प्रोत्साहित किया गया था, वाणिज्यिक विक्रेताओं के अन्य मूल्यांकन कम उत्साही रहे हैं। Pasek et al. (2014) खराब गुणवत्ता मिली जब सर्वेक्षण से डेटा की तुलना मार्केटिंग सिस्टम्स ग्रुप से उपभोक्ता फाइल के साथ की गई थी (जो स्वयं तीन प्रदाताओं से डेटा मिलाकर मिला: Acxiom, Experian, और InfoUSA)। यही है, डेटा फ़ाइल सर्वेक्षण प्रतिक्रियाओं से मेल नहीं खाती है कि शोधकर्ताओं को सही होने की उम्मीद है, उपभोक्ता फ़ाइल में बड़ी संख्या में प्रश्नों के लिए डेटा गुम हो गया था, और गायब डेटा पैटर्न रिपोर्ट किए गए सर्वेक्षण मूल्य से संबंधित था (दूसरे शब्दों में, गायब डेटा व्यवस्थित था, यादृच्छिक नहीं)।
सर्वेक्षण और प्रशासनिक डेटा के बीच रिकॉर्ड लिंक पर अधिक जानकारी के लिए, Sakshaug and Kreuter (2012) और Sakshaug and Kreuter (2012) Schnell (2013) । सामान्य रूप से रिकॉर्ड लिंक पर अधिक जानकारी के लिए, Dunn (1946) और Fellegi and Sunter (1969) (ऐतिहासिक) और Larsen and Winkler (2014) (आधुनिक) देखें। कम्प्यूटर साइंस में डेटा deduplication, इंस्टेंस पहचान, नाम मिलान, डुप्लिकेट पहचान, और डुप्लिकेट रिकॉर्ड पहचान (Elmagarmid, Ipeirotis, and Verykios 2007) जैसे नामों के तहत इसी तरह के दृष्टिकोण भी विकसित किए गए हैं। ऐसे लिंक को रिकॉर्ड करने के लिए गोपनीयता-संरक्षण दृष्टिकोण भी हैं जिन्हें व्यक्तिगत रूप से पहचानने वाली जानकारी (Schnell 2013) के संचरण की आवश्यकता नहीं होती है। फेसबुक के शोधकर्ताओं ने अपने रिकॉर्ड को संभावित व्यवहार (Jones et al. 2013) संभावित रूप से जोड़ने के लिए एक प्रक्रिया विकसित की; यह लिंक एक प्रयोग का मूल्यांकन करने के लिए किया गया था जिसे मैं आपको अध्याय 4 (Bond et al. 2012) में बताऊंगा। रिकॉर्ड लिंकेज के लिए सहमति प्राप्त करने के लिए, Sakshaug et al. (2012) देखें Sakshaug et al. (2012) ।
सरकारी प्रशासनिक अभिलेखों के लिए बड़े पैमाने पर सामाजिक सर्वेक्षण को जोड़ने का एक और उदाहरण स्वास्थ्य और सेवानिवृत्ति सर्वेक्षण और सामाजिक सुरक्षा प्रशासन से आता है। उस अध्ययन पर अधिक जानकारी के लिए, सहमति प्रक्रिया के बारे में जानकारी सहित, ओल्सन (1996, 1999) ।
एक मास्टर डेटाफाइल में प्रशासनिक रिकॉर्ड के कई स्रोतों को संयोजित करने की प्रक्रिया- कैटलिस्ट नियोजित प्रक्रिया - कुछ राष्ट्रीय सरकारों के सांख्यिकीय कार्यालयों में आम है। सांख्यिकी स्वीडन के दो शोधकर्ताओं ने इस विषय पर एक विस्तृत पुस्तक लिखी है (Wallgren and Wallgren 2007) । संयुक्त राज्य अमेरिका में एक ही काउंटी में इस दृष्टिकोण के उदाहरण के लिए (ओल्मस्टेड काउंटी, मिनेसोटा; मेयो क्लिनिक का घर), Sauver et al. (2011) । प्रशासनिक रिकॉर्ड में दिखाई देने वाली त्रुटियों के बारे में अधिक जानकारी के लिए, Groen (2012) ।
सर्वेक्षण शोध में शोधकर्ता बड़े डेटा स्रोतों का उपयोग कर सकते हैं एक और तरीका विशिष्ट विशेषताओं वाले लोगों के लिए एक नमूना फ्रेम के रूप में है। दुर्भाग्यवश, यह दृष्टिकोण गोपनीयता से संबंधित प्रश्न उठा सकता है (Beskow, Sandler, and Weinberger 2006) ।
बढ़ी हुई पूछताछ के संबंध में, यह दृष्टिकोण उतना नया नहीं है जितना कि मैंने इसका वर्णन कैसे किया है। आंकड़ों में तीन बड़े क्षेत्रों के साथ गहरे संबंध हैं: मॉडल आधारित पोस्ट-स्तरीकरण (Little 1993) , प्रतिनियुक्ति (Rubin 2004) , और छोटे क्षेत्र के आकलन (Rao and Molina 2015) । यह चिकित्सा अनुसंधान (Pepe 1992) में सरोगेट चर के उपयोग से भी संबंधित है।
Blumenstock, Cadamuro, and On (2015) में लागत और समय अनुमान एक और अतिरिक्त सर्वेक्षण की लागत को संदर्भित करते हैं- और कॉल डेटा की सफाई और प्रसंस्करण की लागत जैसे निश्चित लागत शामिल नहीं करते हैं। आम तौर पर, बढ़ी हुई पूछताछ में डिजिटल प्रयोगों के समान उच्च निश्चित लागत और कम परिवर्तनीय लागत होगी (अध्याय 4 देखें)। विकासशील देशों में मोबाइल फोन आधारित सर्वेक्षणों के बारे में अधिक जानकारी के लिए, Dabalen et al. (2016) ।
बेहतर पूछने के तरीके के बारे में विचारों के लिए, मैं एकाधिक प्रतिबाधा (Rubin 2004) बारे में अधिक जानने की सलाह दूंगा। इसके अलावा, यदि शोधकर्ता व्यक्तिगत स्तर के लक्षणों की बजाय कुल गणना के बारे में पूछने के लिए बढ़ाए गए हैं, तो King and Lu (2008) और Hopkins and King (2010) में दृष्टिकोण उपयोगी हो सकते हैं। अंत में Blumenstock, Cadamuro, and On (2015) में मशीन लर्निंग दृष्टिकोण के बारे में अधिक जानकारी के लिए, James et al. (2013) (अधिक प्रारंभिक) या Hastie, Tibshirani, and Friedman (2009) (अधिक उन्नत)।
बढ़ी हुई पूछताछ के संबंध में एक नैतिक मुद्दा यह है कि इसका उपयोग संवेदनशील लक्षणों का अनुमान लगाने के लिए किया जा सकता है कि लोग Kosinski, Stillwell, and Graepel (2013) में वर्णित सर्वेक्षण में प्रकट होने का विकल्प नहीं चुन सकते हैं।