तो घाणेरडा असू शकते असला तरी, समृद्ध विचारत शक्तिशाली असू शकते.
डिजिटल शोध काढूण डेटा अपुरेपणा वागण्याचा एक भिन्न दृष्टिकोन सर्वेक्षण डेटा, मी समृद्ध विचारत कॉल करू की एक प्रोसेस थेट समृद्ध आहे. समृद्ध विचारून एक उदाहरण म्हणजे अभ्यास आहे Burke and Kraut (2014) मी Facebook वर संवाद मैत्री शक्ती देते की नाही याबद्दल, धडा पूर्वी वर्णन जे (विभाग 3.2). अशा बाबतीत, विजयकुमार आणि Kraut फेसबुक लॉग डेटा सर्वेक्षण डेटा एकत्र.
विजयकुमार आणि Kraut मध्ये काम होते की सेटिंग, तथापि, ते नाही, संशोधक समृद्ध विचारत चेहरा करत दोन मोठ्या समस्या सामोरे आहेत बोलत. प्रथम, प्रत्यक्षात डेटा सेट-एक प्रोसेस म्हणतात रेकॉर्ड लिंकेज, खालील ही समस्या इतर डेटासेटमध्ये-शकता कठीण व त्रुटी प्रवण असू (आम्ही दिसेल एक उदाहरण योग्य रेकॉर्ड एक डेटासेटमध्ये रेकॉर्ड जुळणारे एकत्र लिंकिंग ). समृद्ध विचारत दुसऱ्या मुख्य समस्या डिजिटल मागोवा गुणवत्ता वारंवार संशोधक घेणं कठीण होईल. उदाहरणार्थ, कधी कधी ती संकलित आहे ज्याद्वारे प्रक्रिया मालकी आहे आणि धडा 2. वर्णन दुसऱ्या शब्दांत समस्या अनेक संवेदनाक्षम असू शकते, समृद्ध विचारून वारंवार अज्ञात काळा-बॉक्स डेटा सूत्रांनी सर्वेक्षण त्रुटी-पोटावार चेहरा खाली करून झोपणे दुवा साधण्यास समावेश असेल गुणवत्ता. या दोन समस्या परिचय चिंता असूनही, तो म्हणून स्टीफन Ansolabehere आणि Eitan Hersh द्वारे प्रात्यक्षिक होते हे धोरण महत्त्वाचा संशोधन करणे शक्य आहे (2012) यूएस मध्ये मतदान पद्धतींवर संशोधन मध्ये. काही तपशील या अभ्यास जायचे फायदेशीर आहे Ansolabehere आणि Hersh विकसित समृद्ध विचारत इतर अनुप्रयोग मध्ये उपयुक्त होईल नीती अनेक कारण.
मतदान राज्यशास्त्र मध्ये व्यापक संशोधन विषय आहे, आणि पूर्वी मतदान आणि का साधारणपणे सर्वेक्षण डेटा विश्लेषण आधारित करण्यात आली आहे हे संशोधन 'समज. यूएस मध्ये मतदान, तथापि, प्रत्येक नागरिक मतदान केले आहे की किंवा नाही हे सरकारी रेकॉर्ड मध्ये एक असामान्य वर्तन आहे (अर्थातच, शासनाने प्रत्येक नागरिक मते रेकॉर्ड करत नाही). अनेक वर्षे, या सरकारी मतदान रेकॉर्ड देशातील सुमारे विविध स्थानिक सरकारी कार्यालये विखुरलेल्या कागद फॉर्म वर उपलब्ध होते. अवघड, पण अशक्य नाही, राजकीय शास्त्रज्ञ मतदार संपूर्ण चित्र आहे आणि लोक त्यांच्या प्रत्यक्ष मतदान वर्तनावर मतदान सर्वेक्षण मध्ये काय म्हणतात तुलना केली (Ansolabehere and Hersh 2012) .
पण, आता या मतदान रेकॉर्ड डिजिटल पद्धतीने निश्चित करण्यात आल्या आहेत, आणि खाजगी कंपन्या अनेक पद्धतशीरपणे गोळा केले आणि सर्व अमेरिकन मतदान वर्तन रेकॉर्ड की व्यापक मालक मतदान फाइल निर्मिती या मतदान रेकॉर्ड विलीन. Ansolabehere आणि Hersh मतदारांचा चांगले चित्र विकसित करण्यात मदत करण्यासाठी आपल्या धन्याच्या मतदान फाइल वापर करण्यासाठी LCC-या कंपन्या-Catalist एक भागीदारी केली. अधिक, तो गोळा आणि कंपनी यांनी काढलेल्या डिजिटल रेकॉर्ड प्रयत्न, हे कंपन्या मदत आणि analog रेकॉर्ड वापर न करता केल्या संशोधक मागील प्रयत्न प्रती अनेक फायदे देऊ.
Chapter 2 मध्ये डिजिटल शोध काढूण स्रोत अनेक प्रमाणे, Catalist मालक फाइल Ansolabehere आणि Hersh आवश्यक आहे, लोकसंख्याशास्त्रीय वृत्तीमुळे येणारे अडथळे, आणि वर्तणुकीशी माहिती जास्त समाविष्ट नाही. ही माहिती व्यतिरिक्त, Ansolabehere आणि Hersh सत्यापित मतदान वर्तन (म्हणजेच Catalist डेटाबेसमध्ये माहिती) अहवाल मतदान वर्तन तुलना विशेषतः रस होते. त्यामुळे, संशोधक सहकारी पक्षातील निवडणूक अभ्यास (CCES), मोठ्या सामाजिक सर्वेक्षण भाग म्हणून होते की डेटा गोळा. पुढे, संशोधक Catalist हा डेटा दिला, आणि Catalist संशोधक मतदान वर्तन तपासले समाविष्ट आहे (Catalist पासून) एका विलीन डेटा फाइल, स्वत: ची अहवाल मतदान वर्तन (CCES) आणि लोकसंख्याशास्त्र आणि सर्वेक्षणात दृष्टिकोन बॅकअप (CCES दिला ). दुसऱ्या शब्दांत, Ansolabehere आणि Hersh सर्वेक्षण डेटा मतदान डेटा समृद्ध, आणि परिणामी विलीन फाइल त्यांना नाही फाइल वैयक्तिकरित्या सक्षम काहीतरी करण्यास सक्षम करते.
सर्वेक्षण डेटा Catalist मास्टर डेटा फाइल समृद्ध करुन, Ansolabehere आणि Hersh तीन महत्त्वाचे निष्कर्ष आले. प्रथम, प्रती-अहवाल मतदान सर्रासपणे होत आहे: नॉन-मतदार जवळजवळ अर्धा अहवाल मतदान. किंवा, तो बघत आणखी एक मार्ग कोणीतरी मतदान नोंदवले तर आहे, ते प्रत्यक्षात मतदान फक्त 80% संधी आहे. दुसरी गोष्ट म्हणजे, प्रती-अहवाल यादृच्छिक नाही; प्रती-अहवाल सुशिक्षित उच्च उत्पन्न लोकांमध्ये अधिक सामान्य आहे, सार्वजनिक व्यवहार गुंतलेली आहेत partisans. दुसऱ्या शब्दांत, मतदान बहुधा लोक सर्वात मतदान खोटे शक्यता आहे. तिसरा, आणि सर्वात गंभीर, कारण प्रती-अहवाल, मतदार आणि नॉन-मतदार दरम्यान प्रत्यक्ष फरक ते सर्वेक्षण फक्त दिसतात पेक्षा लहान आहेत पद्धतशीर निसर्ग. उदाहरणार्थ, पदवी त्या सुमारे 22 टक्क्याने मतदान अहवाल होण्याची अधिक शक्यता असते, परंतु प्रत्यक्ष मत केवळ 10 टक्क्याने अधिक शक्यता असते. पुढील मतदानाची विद्यमान संसाधन आधारित सिद्धांत कोण प्रत्यक्षात मते, नवीन सिद्धांत समजून आणि मतदान अंदाज कॉल एक प्रायोगिक शोध पेक्षा मतदान तक्रार नोंदवा भाकीत जास्त चांगले आहेत.
पण, किती आम्ही हे परिणाम विश्वास ठेवू नये? हे परिणाम त्रुटी अज्ञात प्रमाणात काळा-बॉक्स डेटा त्रुटी-पोटावार चेहरा खाली करून झोपणे दुवा साधण्यास अवलंबून लक्षात ठेवा. 1) अचूक मास्टर datafile आणि 2) मास्टर datafile करण्यासाठी सर्वेक्षण डेटा दुवा Catalist क्षमता निर्मिती अनेक पूर्णपणे वेगळया प्रकारचा डेटा स्रोत एकत्र Catalist क्षमता: अधिक विशेषतः, परिणाम दोन कि पावले अवलंबून. या पायऱ्या प्रत्येक जोरदार कठीण आहे आणि एकतर टप्प्यावर त्रुटी चुकीचे संशोधक होऊ शकते. तथापि, म्हणून अनेकदा संशोधन कोणतीही व्यक्ती शैक्षणिक संशोधक किंवा गट जुळत करू शकता की एक प्रमाणात, या समस्या सोडवणे संसाधने गुंतवणूक करू शकता डेटा प्रोसेसिंग आणि जुळणारे दोन्ही एक कंपनी म्हणून Catalist चालू अस्तित्व महत्वपूर्ण आहेत. प्रकरणा या शेवटी अधिक वाचनासाठी, मी अधिक तपशील आणि कसे Ansolabehere आणि Hersh त्यांच्या परिणामांमध्ये आत्मविश्वास निर्माण या समस्या वर्णन. ही माहिती या अभ्यासात खास तरी, या सारखे मुद्दे काळा-बॉक्स डिजिटल शोध काढूण डेटा स्रोत दुवा बनवू इतर संशोधक उदयास येतील.
सामान्य धडे संशोधक या अभ्यास काढू शकता काय आहेत? प्रथम, सर्वेक्षण डेटा डिजिटल मागोवा समृद्ध पासून प्रचंड मूल्य आहे. दुसरी गोष्ट म्हणजे, या एकत्रित तरी, व्यावसायिक डेटा स्रोत "ग्राउंड सत्य" मानला जाऊ नये, काही बाबतीत ते उपयोगी असू शकते. खरं तर, तो या डेटा स्रोत (ते नेहमी कमी पडू जेथून) परिपूर्ण सत्य नाही तुलना करा सर्वोत्तम आहे. उलट, तो नेहमी तसेच त्रुटी इतर डेटा उपलब्ध सूत्रांच्या माहितीनुसार त्यांना तुलना करणे चांगले आहे.