या अध्यायातील बरेच विषय देखील अमेरिकन असोसिएशन ऑफ पब्लिक ओपिनियन रिसर्च (एएपीओआर) येथे अलीकडेच राष्ट्रपती पदाच्या पत्त्यात प्रतिध्वनीित करण्यात आले आहेत, जसे की Dillman (2002) , Newport (2011) , Santos (2014) आणि Link (2015) .
सर्वेक्षण संशोधन आणि सखोल मुलाखतीमधील फरक अधिक जाणून घेण्यासाठी, Small (2009) . सखोल मुलाखतींशी संबंधीत मानववंशशास्त्र असे संबोधले जाणारे एक कुटुंब आहे. Ethnographic संशोधनात, संशोधक सहसा त्यांच्या नैसर्गिक वातावरणातील जास्त वेळ खर्च करतात. Jerolmack and Khan (2014) सखोल मुलाखती दरम्यान फरक अधिक साठी, पहा Jerolmack and Khan (2014) . डिजिटल नृत्यांगनाबद्दल अधिक जाणून घेण्यासाठी, Pink et al. (2015) .
सर्वेक्षणातील संशोधनाच्या इतिहासाचे माझे वर्णन हे अशा अनेक रोमांचक घटनांचा समावेश करण्यासाठी खूपच संक्षिप्त आहे. अधिक ऐतिहासिक पार्श्वभूमीसाठी, Smith (1976) , Converse (1987) , आणि Igo (2008) . सर्वे रिसर्चच्या तीन युगाच्या अधिक माहितीसाठी, Groves (2011) आणि Dillman, Smyth, and Christian (2008) (जे तीन वेगवेगळ्या कालखंडात वेगळ्या पद्धतीने मोडतात) पहा.
Groves and Kahn (1979) फेस-टू-फेस आणि टेलिफोन सर्वेक्षणामध्ये विस्तृत डोके-ते-सिर तुलना करुन सर्वेक्षण संशोधनात पहिल्या व दुस-या कालखंडामध्ये संक्रमण पहातात. ( ??? ) यादृच्छिक आकड्या-डायलिंग नमूना पद्धतींचे ऐतिहासिक विकासाकडे मागे पहा.
समाजातील बदलांच्या प्रतिसादात भूतकाळात सर्वेक्षण संशोधन कसे बदलले आहे याबद्दल Tourangeau (2004) , ( ??? ) , आणि Couper (2011) .
मनोविज्ञानी (उदा. Baumeister, Vohs, and Funder (2007) ) आणि समाजशास्त्रज्ञ (उदा. Jerolmack and Khan (2014) , Maynard (2014) , Cerulo (2014) ; Vaisey (2014) Cerulo (2014) Vaisey (2014) ताकद आणि कमकुवतपणाबद्दल चर्चा झाली आहे. Vaisey (2014) ; Jerolmack and Khan (2014) ] विचार आणि निरीक्षण यातील फरक देखील अर्थशास्त्र मध्ये उद्भवला जातो, जेथे संशोधक सांगितले आणि उघड प्राधान्ये बद्दल चर्चा .उदाहरणार्थ, एक संशोधक उत्तरप्रेषींना ते आइसक्रीम खाणे किंवा जिम (म्हटल्याप्रमाणे प्राधान्यक्रम), किंवा आईस्क्रीम खाण्यास किती वेळ जातो आणि व्यायामशाळेत जाणे (प्राधान्यप्राप्त) वर जाणे शक्य आहे. Hausman (2012) मध्ये वर्णन केल्यानुसार अर्थशास्त्रातील विशिष्ट प्रकारचे उल्लेख केलेल्या प्राधान्य डेटाबद्दल गहन नाखूष आहे.
या वादविवादांमधील एक मुख्य थीम अशी आहे की अहवालानुसार व्यवहार नेहमी अचूक नसतो. परंतु, धडा 2 मध्ये सांगितल्याप्रमाणे, मोठा डेटा स्रोत अचूक नसू शकतो, ते व्याजांच्या नमुन्यावर संग्रहित केले जाऊ शकत नाहीत, आणि ते संशोधकांसाठी प्रवेशयोग्य नसतात. याप्रमाणे, मला वाटते की, काही परिस्थितींमध्ये, अहवाल देण्याची पद्धत उपयोगी असू शकते. पुढे, या वादविवादांमधील दुसरा मुख्य विषय म्हणजे भावना, ज्ञान, अपेक्षा आणि मते याबद्दलची माहिती नेहमी अचूक नसते. परंतु, जर या आंतरिक राज्यांविषयी माहिती शोधकारांकडून आवश्यक असेल तर - काही व्यवहारांचे स्पष्टीकरण देण्याकरिता किंवा स्पष्ट करण्याजोगी वस्तू म्हणून - नंतर विचारणे योग्य असू शकते. अर्थात, प्रश्न विचारून अंतर्गत राज्यांविषयी शिकणे समस्याप्रधान असू शकते कारण कधीकधी प्रतिसादकर्त्यांना स्वतःच्या अंतर्गत राज्यांविषयी माहिती नसते (Nisbett and Wilson 1977) .
Groves (2004) धडा 1 Groves (2004) सर्वेक्षणातील संशोधकांनी एकूण सर्वेक्षण त्रुटी फ्रेमवर्कचे वर्णन करण्यासाठी वापरलेले अधूनमधून विसंगत परस्परांशी जुळणारे एक उत्कृष्ट कार्य करते. एकूण सर्वेक्षण त्रुटी फ्रेमवर्कच्या एक पुस्तक-लांबीच्या उपचारासाठी Groves et al. (2009) पहा Groves et al. (2009) , आणि ऐतिहासिक अवलोकनकरिता, Groves and Lyberg (2010) .
चुका आणि त्रुटी मध्ये विघटित कल्पना देखील मशीन शिक्षण मध्ये येतो; उदाहरणार्थ, Hastie, Tibshirani, and Friedman (2009) विभाग 7.3 पाहा. हे बर्याचदा संशोधकांना "बायस-विचरण" व्यापार-बंद करण्याबद्दल चर्चा करतात
प्रतिनिधित्वाच्या संदर्भात, गैर-उत्तरदायित्व आणि गैर-प्रतिक्रियेच्या पूर्वाभिमुख मुद्द्यांबद्दलची एक उत्तम परिचय म्हणजे राष्ट्रीय विज्ञान परिषद अहवालात सामाजिक विज्ञान सर्वेक्षणांमध्ये गैर-प्रतिसाद: एक संशोधन कार्यक्रम (2013) . Groves (2006) द्वारे आणखी एक उपयुक्त अवलोकन प्रदान केले आहे. जर्नल ऑफ ऑफिसिक स्टॅटिस्टिक्स , पब्लिक ओपिनियन क्वार्टरली आणि अॅनल्स ऑफ द अमेरिकन ऍकॅडमी ऑफ पॉलिटिकल अँड सोशल सायन्स या विषयांच्या सर्व विषयांवर या विषयावर प्रतिक्रिया देण्यात आली आहे. अखेरीस, प्रत्यक्षात प्रतिसाद दर गणना करण्याचे अनेक भिन्न मार्ग आहेत; द अमेरिकन असोसिएशन ऑफ पब्लिक ओपिनियन रिसर्चर्स (एएपीओआर) ( ??? ) अहवालात तपशीलवार वर्णन केले आहे.
1 9 36 च्या साहित्य Cahalan (1989) अधिक माहितीसाठी Bryson (1976) , Squire (1988) , Cahalan (1989) आणि Lusinchi (2012) . अनपेक्षित डेटा संकलनाबद्दलच्या Gayo-Avello (2011) इशार्यानुसार या सर्वेक्षणाची दुसर्या चर्चासाठी, Gayo-Avello (2011) . 1 9 36 मध्ये जॉर्ज गॅलुपने अधिक अत्याधुनिक नमुने नमूना वापरली आणि बरेच अचूक अंदाज सादर करण्यास सक्षम होते. लिटररी डाइजेस्टवरील गॅलुपची यश सर्वेक्षण संशोधनाच्या विकासातील एक महत्त्वाचा टप्पा होता ज्याचे वर्णन @ कन्व्हर्स_सुरवीः 1 9 87 चे अध्याय 3 मध्ये दिले आहे; Ohmer (2006) 4 9 Ohmer (2006) प्रकरण 4; आणि @ igo_averaged_2008 च्या अध्याय 3
मापन दृष्टीने, प्रश्नावली डिझाइन करण्यासाठी एक उत्तम प्रथम स्त्रोत Bradburn, Sudman, and Wansink (2004) . अधिक प्रगत उपचारांसाठी, Schuman and Presser (1996) , जे विशेषत: वृत्ती प्रश्नांवर केंद्रित आहे, आणि Saris and Gallhofer (2014) , जे अधिक सामान्य आहे. ( ??? ) मध्ये वर्णन केल्यानुसार मोजण्यासाठी एक वेगळा दृष्टिकोन मनोचलित पद्धतीने घेतला जातो. प्रेसिंगवर अधिक Presser and Blair (1994) , Presser et al. (2004) , Groves et al. (2009) अध्याय 8 Groves et al. (2009) . सर्वेक्षण प्रयोगांविषयी अधिक माहितीसाठी, Mutz (2011) .
Groves (2004) सर्वेक्षण खर्च आणि सर्वेक्षण Groves (2004) व्यापार-बंद करण्याच्या क्लासिक, पुस्तक-लांबीच्या उपचाराच्या दृष्टीने.
Lohr (2009) (अधिक प्रास्ताविक) आणि Särndal, Swensson, and Wretman (2003) आणि Särndal, Swensson, and Wretman (2003) (अधिक प्रगत) - मानक संभाव्यता नमूना आणि अंदाज दोन क्लासिक पुस्तक-लांबी उपचार आहेत. पोस्ट स्तरीकरण आणि संबंधित पद्धतींचे क्लासिक पुस्तक-लांबीचे उपचार हे Särndal and Lundström (2005) . काही डिजिटल-वय सेटिंग्जमध्ये, संशोधकांना नॉन-पेंडंट्सबद्दल थोडी माहिती आहे, जे पूर्वी भूतकाळात सत्य नव्हते. Kalton and Flores-Cervantes (2003) आणि Smith (2011) द्वारे वर्णन केल्यानुसार Kalton and Flores-Cervantes (2003) माहिती असल्यावर वेगवेगळ्या प्रकारच्या गैर-प्रतिक्रिया समायोजन शक्य आहेत.
W. Wang et al. (2015) द्वारे Xbox अभ्यास W. Wang et al. (2015) बहुस्तरीय प्रतिगमन आणि पोस्ट स्तरीकरण ("मिस्टर पी.") नावाची तंत्रज्ञानाद्वारे संशोधकांना समूहांचा अंदाज लावण्यास अनुमती देते, अगदी अनेक गट असले तरीही. या तंत्रज्ञानाच्या अंदाजाच्या गुणवत्तेविषयी काही वाद आहे तरीपण ते शोधण्याचे एक आशाजनक क्षेत्र आहे असे दिसते. ही पद्धत प्रथम Park, Gelman, and Bafumi (2004) मध्ये वापरली गेली आणि नंतर वापर आणि वादविवाद झाले (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . वैयक्तिक वजन आणि गट वजा यांच्यातील संबंध अधिक जाणून घेण्यासाठी, Gelman (2007) .
वेब Schonlau et al. (2009) इतर पद्धतींसाठी, Schonlau et al. (2009) पाहा Schonlau et al. (2009) , Bethlehem (2010) , आणि Valliant and Dever (2011) . ऑनलाइन पॅनेल संभाव्यता नमूने किंवा गैर-संभाव्यता नमूने वापरु शकता. ऑनलाइन पॅनल्सवर अधिकसाठी, Callegaro et al. (2014) पाहा Callegaro et al. (2014) .
कधीकधी, संशोधकांनी असे आढळले की संभाव्यतेचे नमुने आणि गैर-संभाव्यतेचे नमूने अशाच प्रकारची गुणवत्ता (Ansolabehere and Schaffner 2014) अंदाज करतात, परंतु इतर तुलनेने असे आढळले की गैर-संभाव्यतेचे नमुने खराब होतात (Malhotra and Krosnick 2007; Yeager et al. 2011) . या फरकाचा एक संभाव्य कारण म्हणजे गैर-संभाव्यता नमुन्यामध्ये वेळेत सुधारणा झाली आहे. गैर-संभाव्यता नमूना पद्धतींच्या अधिक निराशावादी दृष्टिकोनासाठी, एपॉर टास्क फोर्स ऑन नॉन-प्रॉबिलिबिलिटी सॅम्पलिंग (Baker et al. 2013) आणि मी सारांश अहवालानंतरच्या अनुषंगाने वाचण्याची शिफारस करतो.
Conrad and Schober (2008) हे एन्वीसनिंग द सर्वे सर्वे इंटरव्यू ऑफ द फ्यूचर शीर्षक असलेले एक संपादित खंड आहे आणि हे प्रश्न विचारून भविष्याबद्दल विविध दृष्टिकोन देतात. Couper (2011) समान थीम पत्ते, आणि Schober et al. (2015) नवीन सेटिंग्जच्या अनुरूप डेटा संकलन पद्धतींचे उच्च गुणवत्ता असलेले डेटा कसे होऊ शकते याचा एक उत्कृष्ट उदाहरण देतात Schober and Conrad (2015) बदल घडवून घेण्यासाठी सर्च रिसर्चची प्रक्रिया समायोजित करण्याबाबत Schober and Conrad (2015) अधिक सामान्य वितर्क देतात.
Tourangeau and Yan (2007) संवेदनशील प्रश्नांमधील सामाजिक वांछनीयतेच्या पूर्वार्वांचे पुनरावलोकन आणि Lind et al. (2013) लोक संगणक-प्रशासित मुलाखतीत अधिक संवेदनशील माहिती का उघड करतात याचे काही संभाव्य कारण देतात. सर्वेक्षणातील वाढीच्या दरांमध्ये मानवी मुलाखतींच्या भूमिकेबद्दल अधिक माहितीसाठी, Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) , आणि Schaeffer et al. (2013) . मिस-मोड Dillman, Smyth, and Christian (2014) अधिक माहितीसाठी, Dillman, Smyth, and Christian (2014) .
Stone et al. (2007) पर्यावरणीय क्षणिक मूल्यांकन आणि संबंधित पद्धतींचे पुस्तक-लांबीचे उपचार ऑफर करतात.
सर्वेक्षणात सहभागी होण्याकरिता आनंददायक आणि मौल्यवान अनुभव घेण्यासाठी अधिक सल्ल्यासाठी, सिलेटेड डिझाईन पध्दत (Dillman, Smyth, and Christian 2014) वर कार्य पहा. सोशल सायन्स सर्वेक्षणासाठी Facebook अॅप्लिकेशन्स वापरण्याच्या आणखी एका Bail (2015) , Bail (2015) पहा Bail (2015) .
Judson (2007) "माहिती एकीकरण" म्हणून सर्वेक्षणे आणि प्रशासकीय डेटा एकत्रित करण्याच्या प्रक्रियेचे वर्णन करतो आणि या दृष्टिकोनाचे काही फायदे, तसेच काही उदाहरणे सादर करते.
समृद्ध विचारांविषयी मतदानास मान्यता देण्यासाठी बरेच पूर्वीचे प्रयत्न केले आहेत. त्या साहित्याचे विहंगावलोकन करण्यासाठी, Belli et al. (1999) पाहा Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , आणि Berent, Krosnick, and Lupia (2016) . Ansolabehere and Hersh (2012) मध्ये सादर परिणाम अधिक संशयवादी दृश्य साठी Berent, Krosnick, and Lupia (2016) पहा.
हे लक्षात घेणे महत्वाचे आहे की जरी अदोलबेहेरील आणि हर्ह यांना कॅटलिस्टकडून डेटाच्या गुणवत्तेने प्रोत्साहित केले जात असले तरीही व्यावसायिक विक्रेत्यांचे इतर मूल्यांकन कमी उत्साही झाले आहेत. Pasek et al. (2014) विपणन गुणवत्ता गट (जे स्वतः तीन प्रदात्यांकडून डेटा विलय: Acxiom, Experian, आणि InfoUSA) पासून एक सर्वेक्षण फाइल डेटा एक ग्राहक फाइल तुलनेत गरीब गुणवत्ता आढळले. म्हणजेच डेटा फाईल सर्वेक्षणाचे उत्तर शोधण्याशी जुळत नाही जे संशोधकांनी अपेक्षित धरले आहे, ग्राहक फाइलमध्ये मोठ्या संख्येने प्रश्नांसाठी डेटा गहाळ आहे आणि गहाळ डेटा नमुना अहवाल सर्वेक्षण मूल्यासह (इतर शब्दात, गहाळ आहे डेटा पद्धतशीर होता, यादृच्छिक नाही).
सर्वेक्षणे आणि प्रशासकीय डेटा यांच्यातील रेकॉर्ड लिंक्डसाठी अधिक, Sakshaug and Kreuter (2012) आणि Schnell (2013) . सामान्यतः रेकॉर्ड लिंकेजवर अधिक माहितीसाठी Dunn (1946) आणि Fellegi and Sunter (1969) (ऐतिहासिक) आणि Larsen and Winkler (2014) (आधुनिक) पहा. संगणकीय विज्ञानामध्ये डेटा डिडुप्लिकेशन्स, इन्स्टन्स आयडेंटिफिकेशन, (Elmagarmid, Ipeirotis, and Verykios 2007) डुप्लिकेट डिटेक्शन आणि डुप्लिकेट रेकॉर्ड डिटेक्शन (Elmagarmid, Ipeirotis, and Verykios 2007) . वैयक्तिकरित्या ओळखण्यासंबंधीची माहिती प्रसारित करण्याची आवश्यकता नसलेले दुवा जोडण्यासाठी गोपनीयतेचे संरक्षण पध्दती आहेत (Schnell 2013) फेसबुकवरील संशोधकांनी त्यांच्या विक्रमांना मतदान वर्तनावर संभाव्य दुवा जोडण्याचा एक प्रक्रिया विकसित केली (Jones et al. 2013) ; या दुव्याचा उपयोग आपण 4 व्या अध्यायामध्ये सांगू शकाल अशा प्रयोगाचे मूल्यमापन करण्यासाठी केले होते (Bond et al. 2012) रेकॉर्ड Sakshaug et al. (2012) संमती प्राप्त करण्यासाठी अधिक, Sakshaug et al. (2012) पाहा Sakshaug et al. (2012) .
शासकीय प्रशासकीय नोंदींकडे मोठ्या स्तरावरील सामाजिक सर्वेक्षणास जोडण्याचे दुसरे उदाहरण म्हणजे आरोग्य आणि निवृत्ती सर्वेक्षण आणि सामाजिक सुरक्षा प्रशासन. त्या अभ्यासाबद्दल अधिक, संमती प्रक्रियेबद्दलच्या माहितीसह, ओल्सन (1996, 1999) .
प्रशासकीय नोंदींचे अनेक स्रोत एकत्रित करण्याच्या प्रक्रियेस एका मास्टर डेटाफाइलमध्ये -कार्टिस्ट कार्यरत असलेली प्रक्रिया- काही राष्ट्रीय सरकारच्या सांख्यिकीय कार्यालयात सामान्य आहे. स्टॅटिस्टिक्स स्वीडनच्या दोन संशोधकांनी विषयावर एक विस्तृत पुस्तक लिहिले आहे (Wallgren and Wallgren 2007) . युनायटेड स्टेट्समधील एका काउंटीमध्ये या दृष्टिकोनाचा एक उदाहरण (ऑलमस्टेड काउंटी, मिनेसोटा; मेयो क्लिनिकचे घर), Sauver et al. (2011) पाहा Sauver et al. (2011) . प्रशासकीय रेकॉर्डमध्ये दिसू शकणाऱ्या चुकांसाठी अधिक, Groen (2012) .
संशोधक सर्वेक्षण संशोधनात मोठ्या प्रमाणात डेटा स्त्रोत वापरू शकतात हे आणखी एक मार्ग म्हणजे विशिष्ट वैशिष्ट्यांसह असलेल्या लोकांसाठी एक नमूना फ्रेम आहे. दुर्दैवाने, हा दृष्टिकोन गोपनीयता (Beskow, Sandler, and Weinberger 2006) शी संबंधित प्रश्न वाढवू शकतो.
विचारविनिमय करण्याबद्दल विचार करणे हा नवीन दृष्टिकोन नाही कारण कदाचित मी हे कसे वर्णन केले आहे त्यावरून दिसून येईल. आकडेवारीचे तीन मोठ्या क्षेत्रांकडे हे खोल कनेक्शन आहे: मॉडेल-आधारित पोस्ट स्तरीकरण (Little 1993) , दोष (Rubin 2004) , आणि लहान क्षेत्र अंदाज (Rao and Molina 2015) . हे देखील वैद्यकीय संशोधन मध्ये बिशपचा प्रतिनिधिक दुय्यम चलने वापर संबंधित आहे (Pepe 1992) .
Blumenstock, Cadamuro, and On (2015) मधील खर्च आणि वेळ अंदाज हे एका अतिरिक्त सर्वेक्षणावरील खर्चासाठी अधिक किंमत Blumenstock, Cadamuro, and On (2015) - आणि कॉल डेटाची साफसफाई आणि प्रक्रियेची किंमत यासारख्या निश्चित खर्चाचा समावेश नाही. सर्वसाधारणपणे, मोठ्या प्रमाणावर विचारांमध्ये कदाचित उच्च निश्चित खर्चाची आणि डिजिटल प्रयोगांसारख्या कमी वेरियेबल खर्च असण्याची शक्यता आहे (अध्याय 4 पहा). विकसनशील देशांमध्ये मोबाइल फोन आधारित सर्वेक्षणासाठी अधिक, Dabalen et al. (2016) पाहा Dabalen et al. (2016) .
अधिक चांगले विचारण्याबद्दल कसे वर्धित करावे याबद्दल कल्पनांसाठी, मी एकाधिक दोषांबद्दल (Rubin 2004) अधिक शिकण्याची शिफारस करतो. तसेच, संशोधकांनी वैयक्तिक-पातळीवरील गुणांपेक्षा एकाग्रतेबद्दल विचारणा केली असल्यास King and Lu (2008) आणि Hopkins and King (2010) दृष्टिकोन उपयुक्त ठरू शकतात. शेवटी, Blumenstock, Cadamuro, and On (2015) मध्ये मशीन शिकण्याच्या Blumenstock, Cadamuro, and On (2015) अधिक माहितीसाठी James et al. (2013) पाहा James et al. (2013) (अधिक प्रास्ताविक) किंवा Hastie, Tibshirani, and Friedman (2009) (अधिक प्रगत).
विस्तृत विचारण्याबद्दलचे एक नैतिक समस्या म्हणजे Kosinski, Stillwell, and Graepel (2013) मध्ये वर्णन केल्याप्रमाणे लोक एखाद्या सर्वेक्षणात प्रकट करणे निवडू न शकणार्या संवेदनशील गुणांचे अनुमान काढण्यासाठी वापरले जाऊ शकतात.